吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2828|回复: 5
收起左侧

[Python 转载] 爬虫 必备扩展Xpath Helper

[复制链接]
孤妄i 发表于 2022-4-22 16:04
{:301_999:} {:301_999:} 来吾爱六七年了,发过的贴子屈指可数,平时有事没事都会逛逛,今天闲来无事,就给大家分享一下平时码Python时经常用到的小工具吧。{:301_978:}

       “XPath ( XML Path Language,XML 路径语言),是一门在XML文档中查找信息的语言。” 简单来说就是一款专用于chrome内核浏览器的实用型爬虫网页解析工具。

​       还可对查询出的xpath进行编辑,正确编辑的结果将会显示在旁边的结果框,并在网页中高亮显示更便于获取网页数据xpath,从而进行网络数据批量爬取。
      
      (1) 使用前提还是得有lxml库。
[Python] 纯文本查看 复制代码
pip install lxml

      
      (2)下载Xpath Helper扩展
      
      (3)安装
    图片2.png


      (4)安装完成以后最好重启电脑,不然可能没反应
Snipaste_2022-04-22_15-41-19.png


        使用

           1、打开某个网站,打开当当网,打开审查元素,找到拷贝目标元素的XPath获取目标元素的XPath,接下来要做什么就看你需要什么了。
     
      Snipaste_2022-04-22_15-49-25.png
           2,但是这个插件基本是配合Scrapy框架食用。

       Snipaste_2022-04-22_15-53-27.jpg
xpath-helper.zip (132.99 KB, 下载次数: 116)

大家打赏点币{:301_999:} 没币逛论坛了

免费评分

参与人数 2吾爱币 +2 热心值 +1 收起 理由
80233 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
sxzx + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

小航 发表于 2022-4-22 21:52
不如正则
醉里流年 发表于 2022-4-23 09:25
https://getquicker.net/Sharedaction?code=fbefe3d4-8c78-43bb-5d02-08d8e803116b
和这个一样的效果么
zm55555 发表于 2022-4-23 09:41
Anolecrab 发表于 2022-4-23 17:58
chrome自带这个功能啊
Jietu20220423-175743.jpg
music984 发表于 2022-4-24 09:49
Anolecrab 发表于 2022-4-23 17:58
chrome自带这个功能啊

自带的这个好像不好用
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 07:15

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表