爬虫 必备扩展Xpath Helper
{:301_999:} {:301_999:} 来吾爱六七年了,发过的贴子屈指可数,平时有事没事都会逛逛,今天闲来无事,就给大家分享一下平时码Python时经常用到的小工具吧。{:301_978:}“XPath ( XML Path Language,XML 路径语言),是一门在XML文档中查找信息的语言。” 简单来说就是一款专用于chrome内核浏览器的实用型爬虫网页解析工具。
还可对查询出的xpath进行编辑,正确编辑的结果将会显示在旁边的结果框,并在网页中高亮显示更便于获取网页数据xpath,从而进行网络数据批量爬取。
(1) 使用前提还是得有lxml库。pip install lxml
(2)下载Xpath Helper扩展
(3)安装
(4)安装完成以后最好重启电脑,不然可能没反应
使用
1、打开某个网站,打开当当网,打开审查元素,找到拷贝目标元素的XPath获取目标元素的XPath,接下来要做什么就看你需要什么了。
2,但是这个插件基本是配合Scrapy框架食用。
大家打赏点币{:301_999:} 没币逛论坛了
不如正则 https://getquicker.net/Sharedaction?code=fbefe3d4-8c78-43bb-5d02-08d8e803116b
和这个一样的效果么 谢谢分享! chrome自带这个功能啊
Anolecrab 发表于 2022-4-23 17:58
chrome自带这个功能啊
自带的这个好像不好用
页:
[1]