Python 的BeautifulSoup库求助！

吧唧小脆脆 · 发表于 2019-9-18 21:23

就用beautifulsoup来解析数据的时候
一般是这样写：soup = beautifulsoup(markup,'html.parser')
这就代表使用的是beautifulsoup库中系统自带的解析器html.parser嘛，那然后他的那个markup是啥
为何我看爬虫书上的markup变成了一个定义的名字.text ，然后我自己修改一下就报错

986244073 · 发表于 2019-9-18 21:58

第一个参数是传解析的文本第二个是解析方式

小楠 · 发表于 2019-9-18 21:59

要不你这样写？

[Python] 纯文本查看 复制代码

response = requests.get('http://bj.xiaozhu.com/').text

soup = BeautifulSoup(resp,'html.parser')

吧唧小脆脆 · 发表于 2019-9-18 22:02

小楠发表于 2019-9-18 21:59
要不你这样写？
[mw_shl_code=python,true]response = requests.get('http://bj.xiaozhu.com/').text

懂了，就是没有为什么，反正加上text 就对了是吗

柒渡 · 发表于 2019-9-19 09:34

吧唧小脆脆发表于 2019-9-18 22:02
懂了，就是没有为什么，反正加上text 就对了是吗

text是获取文本，你要不先往前补补基础

standyy · 发表于 2019-9-20 01:14

看上去像是崔大的书啊。

yth492300648 · 发表于 2019-9-27 17:53

别看书用xpath

黑黑黑猪儿 · 发表于 2019-10-1 17:42

你可以看一下requests库返回的response对象有哪些常用方法, text只是其中的一种, 根据需要来选择, 去看requests库的文档

timsxh · 发表于 2019-10-12 18:10

美汤不美，请用 xpath

帐号		自动登录	找回密码
密码			注册[Register]

[求助] Python 的BeautifulSoup库求助！