吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1551|回复: 8
收起左侧

[求助] Python 的BeautifulSoup库求助!

[复制链接]
吧唧小脆脆 发表于 2019-9-18 21:23
就用beautifulsoup来解析数据的时候
一般是这样写:soup = beautifulsoup(markup,'html.parser')
这就代表使用的是beautifulsoup库中系统自带的解析器html.parser嘛,那然后他的那个markup是啥
为何我看爬虫书上的markup变成了一个    定义的名字.text  ,然后我自己修改一下就报错

书本上的markup

书本上的markup

这是代码里的名字.text

这是代码里的名字.text

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

986244073 发表于 2019-9-18 21:58
第一个参数是传解析的文本 第二个是解析方式
小楠 发表于 2019-9-18 21:59
要不你这样写?
[Python] 纯文本查看 复制代码
response = requests.get('http://bj.xiaozhu.com/').text

soup = BeautifulSoup(resp,'html.parser')
 楼主| 吧唧小脆脆 发表于 2019-9-18 22:02
小楠 发表于 2019-9-18 21:59
要不你这样写?
[mw_shl_code=python,true]response = requests.get('http://bj.xiaozhu.com/').text

懂了,就是没有为什么,反正加上text 就对了是吗
柒渡 发表于 2019-9-19 09:34
吧唧小脆脆 发表于 2019-9-18 22:02
懂了,就是没有为什么,反正加上text 就对了是吗

text是获取文本,你要不先往前补补基础
standyy 发表于 2019-9-20 01:14
看上去像是崔大的书啊。
yth492300648 发表于 2019-9-27 17:53
别看书 用xpath
黑黑黑猪儿 发表于 2019-10-1 17:42
你可以看一下requests库返回的response对象有哪些常用方法,  text只是其中的一种, 根据需要来选择, 去看requests库的文档
timsxh 发表于 2019-10-12 18:10
美汤不美,请用 xpath
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-27 00:41

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表