吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2059|回复: 7
收起左侧

[Python 转载] 解决小伙伴的一个2020年的问题

[复制链接]
倾情 发表于 2021-1-26 09:32
image.png
这里回复一个小伙伴的问题(好长时间的一个问题,不知道解决没,这里也算笔记记录一下吧),你可以参考一下,另外VScode是可以用Xpath的
(最近实验较多,业务繁忙,很少发帖子了,2021年即可恢复)
[Python] 纯文本查看 复制代码
# -*- coding:UTF-8 -*-
import requests
from lxml import etree


# 1 获取网页数据
req = requests.get("www.baidu.com")
# 2 解析网页
html = etree.HTML(req.content,etree.HTMLParser())
# 3 通过xpath语法获取指定数据
resultIp = html.xpath('//div[@id="list"]/table/tbody/tr/td[@data-title="IP"]/text()')
image.png
image.png

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

minibeetuaman 发表于 2021-1-26 11:13
最后都是由pythonw.exe执行脚本文件,跟用哪种IDE没关系。建议用BeautifulSoup吧
hinome 发表于 2021-1-26 09:50
本帖最后由 hinome 于 2021-1-26 09:51 编辑

学习一下。解决2020问题。。。
jiangpeng59 发表于 2021-1-26 10:19
这提问本身就很奇怪,python的语言特性咋会和代码编辑器相关呢
opst4525 发表于 2021-1-26 11:01
百度有反爬吧?大概
cwl 发表于 2021-1-26 11:05
xpath和编辑器有关系?文本编辑器都可以用啊
可控核聚变 发表于 2021-1-26 22:09
我开始就是用的bs4,后来学了xpath,觉得xpath比bs4好用,速度挺快。后来一哥们让我试试bs4+css选择器,我试了几次,果然真香。xpath还要一顿@@@ /////,bs4+css选择器只要 .  # 选完,代码写起来真是优雅多了。
cdycl 发表于 2021-1-26 22:41
这两都差不多,真正的爬虫还是用的jQ
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 19:46

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表