吧唧小脆脆 发表于 2020-1-17 16:28

爬虫xpath怎么写想要爬取内容的xpath路径啊,挠破头了

上代码,很简单的爬虫代码,我想要爬的是简书网某个页面的标题和文章内容网址如下:https://www.jianshu.com/p/db6f9a7e1814想知道标题的xpath路径怎么写
想知道文章内容的xpath路径怎么写
import requests
from lxml import etree
url = 'https://www.jianshu.com/p/db6f9a7e1814'
html = requests.get(url)
selector = etree.HTML(html.text)
infos = selector.xpath('/div/section/h1/text()')
print(infos)
注:代码里面的路径是错的,爬不出来内容
就只想在我的pycharm里可以显示出这两个内容,我琢磨不出来(写两次路径爬两次,分别显示出这两个内容)


求大神教教我

吧唧小脆脆 发表于 2020-1-17 16:33

我研究来研究去感觉这段代码没错啊
//div[@id="__next"]/div/div/div/section/h1/text()'

吧唧小脆脆 发表于 2020-1-17 16:34

如图,结果就是不显示内容

hbhhwangkun 发表于 2020-1-17 16:36

难学吗?

吧唧小脆脆 发表于 2020-1-17 16:37

hbhhwangkun 发表于 2020-1-17 16:36
难学吗?

还行,多练就好,不过没有人教还是比较难受的

lechenging 发表于 2020-1-17 16:50

chrome 直接 右键copy xpath

minibeetuaman 发表于 2020-1-17 16:57

用beautiful soup,比较顺手

兰色毒药 发表于 2020-1-17 16:58

'//*[@id="__next"]/div/div/div/section/h1/text()'

Wang5201314 发表于 2020-1-17 16:58

‘//*[@id="__next"]/div/div/section/h1/text()'
这样试试

namedlxd 发表于 2020-1-17 17:00

chrome 能直接copy
页: [1] 2 3
查看完整版本: 爬虫xpath怎么写想要爬取内容的xpath路径啊,挠破头了