爬虫xpath怎么写想要爬取内容的xpath路径啊，挠破头了

吧唧小脆脆 · 发表于 2020-1-17 16:28

上代码，很简单的爬虫代码，我想要爬的是简书网某个页面的标题和文章内容网址如下：https://www.jianshu.com/p/db6f9a7e1814想知道标题的xpath路径怎么写
想知道文章内容的xpath路径怎么写
import requests
from lxml import etree
url = 'https://www.jianshu.com/p/db6f9a7e1814'
html = requests.get(url)
selector = etree.HTML(html.text)
infos = selector.xpath('/div/section[1]/h1/text()')
print(infos)
注:代码里面的路径是错的，爬不出来内容
就只想在我的pycharm里可以显示出这两个内容，我琢磨不出来（写两次路径爬两次，分别显示出这两个内容）
1579249563(1).png

求大神教教我

吧唧小脆脆 · 发表于 2020-1-17 16:33

我研究来研究去感觉这段代码没错啊
//div[@id="__next"]/div[1]/div/div/section[1]/h1/text()'

吧唧小脆脆 · 发表于 2020-1-17 16:34

如图，结果就是不显示内容

hbhhwangkun · 发表于 2020-1-17 16:36

难学吗？

吧唧小脆脆 · 发表于 2020-1-17 16:37

hbhhwangkun 发表于 2020-1-17 16:36
难学吗？

还行，多练就好，不过没有人教还是比较难受的

lechenging · 发表于 2020-1-17 16:50

chrome 直接右键copy xpath

minibeetuaman · 发表于 2020-1-17 16:57

用beautiful soup，比较顺手

兰色毒药 · 发表于 2020-1-17 16:58

'//*[@id="__next"]/div[1]/div/div/section[1]/h1/text()'

Wang5201314 · 发表于 2020-1-17 16:58

‘//*[@id="__next"]/div/div/section[1]/h1/text()'
这样试试

namedlxd · 发表于 2020-1-17 17:00

chrome 能直接copy

帐号		自动登录	找回密码
密码			注册[Register]

[求助] 爬虫xpath怎么写想要爬取内容的xpath路径啊，挠破头了