爬虫xpath怎么写想要爬取内容的xpath路径啊，挠破头了

吧唧小脆脆 发表于 2020-1-17 16:28

上代码，很简单的爬虫代码，我想要爬的是简书网某个页面的标题和文章内容网址如下：https://www.jianshu.com/p/db6f9a7e1814想知道标题的xpath路径怎么写
想知道文章内容的xpath路径怎么写
import requests
from lxml import etree
url = 'https://www.jianshu.com/p/db6f9a7e1814'
html = requests.get(url)
selector = etree.HTML(html.text)
infos = selector.xpath('/div/section/h1/text()')
print(infos)
注:代码里面的路径是错的，爬不出来内容
就只想在我的pycharm里可以显示出这两个内容，我琢磨不出来（写两次路径爬两次，分别显示出这两个内容）

求大神教教我

吧唧小脆脆 发表于 2020-1-17 16:33

我研究来研究去感觉这段代码没错啊
//div[@id="__next"]/div/div/div/section/h1/text()'

吧唧小脆脆 发表于 2020-1-17 16:34

如图，结果就是不显示内容

hbhhwangkun 发表于 2020-1-17 16:36

难学吗？

吧唧小脆脆 发表于 2020-1-17 16:37

hbhhwangkun 发表于 2020-1-17 16:36
难学吗？

还行，多练就好，不过没有人教还是比较难受的

lechenging 发表于 2020-1-17 16:50

chrome 直接右键copy xpath

minibeetuaman 发表于 2020-1-17 16:57

用beautiful soup，比较顺手

兰色毒药 发表于 2020-1-17 16:58

'//*[@id="__next"]/div/div/div/section/h1/text()'

Wang5201314 发表于 2020-1-17 16:58

‘//*[@id="__next"]/div/div/section/h1/text()'
这样试试

namedlxd 发表于 2020-1-17 17:00

chrome 能直接copy

页: [1] 2 3

吾爱破解 - 52pojie.cn's Archiver

爬虫xpath怎么写想要爬取内容的xpath路径啊，挠破头了