孤妄i 发表于 2022-4-22 16:04

爬虫 必备扩展Xpath Helper

{:301_999:} {:301_999:} 来吾爱六七年了,发过的贴子屈指可数,平时有事没事都会逛逛,今天闲来无事,就给大家分享一下平时码Python时经常用到的小工具吧。{:301_978:}

       “XPath ( XML Path Language,XML 路径语言),是一门在XML文档中查找信息的语言。” 简单来说就是一款专用于chrome内核浏览器的实用型爬虫网页解析工具。

​       还可对查询出的xpath进行编辑,正确编辑的结果将会显示在旁边的结果框,并在网页中高亮显示更便于获取网页数据xpath,从而进行网络数据批量爬取。
      
      (1) 使用前提还是得有lxml库。pip install lxml
      
      (2)下载Xpath Helper扩展
      
      (3)安装
   


      (4)安装完成以后最好重启电脑,不然可能没反应



      使用

         1、打开某个网站,打开当当网,打开审查元素,找到拷贝目标元素的XPath获取目标元素的XPath,接下来要做什么就看你需要什么了。
   
   
         2,但是这个插件基本是配合Scrapy框架食用。

      


大家打赏点币{:301_999:} 没币逛论坛了

小航 发表于 2022-4-22 21:52

不如正则

醉里流年 发表于 2022-4-23 09:25

https://getquicker.net/Sharedaction?code=fbefe3d4-8c78-43bb-5d02-08d8e803116b
和这个一样的效果么

zm55555 发表于 2022-4-23 09:41

谢谢分享!

Anolecrab 发表于 2022-4-23 17:58

chrome自带这个功能啊

music984 发表于 2022-4-24 09:49

Anolecrab 发表于 2022-4-23 17:58
chrome自带这个功能啊

自带的这个好像不好用
页: [1]
查看完整版本: 爬虫 必备扩展Xpath Helper