好友
阅读权限10
听众
最后登录1970-1-1
|
吧唧小脆脆
发表于 2020-1-17 16:28
上代码,很简单的爬虫代码,我想要爬的是简书网某个页面的标题和文章内容网址如下:https://www.jianshu.com/p/db6f9a7e1814想知道标题的xpath路径怎么写
想知道文章内容的xpath路径怎么写
import requests
from lxml import etree
url = 'https://www.jianshu.com/p/db6f9a7e1814'
html = requests.get(url)
selector = etree.HTML(html.text)
infos = selector.xpath('/div/section[1]/h1/text()')
print(infos)
注:代码里面的路径是错的,爬不出来内容
就只想在我的pycharm里可以显示出这两个内容,我琢磨不出来(写两次路径爬两次,分别显示出这两个内容)
求大神教教我 |
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|