Python 的BeautifulSoup库求助！

吧唧小脆脆 发表于 2019-9-18 21:23

就用beautifulsoup来解析数据的时候
一般是这样写：soup = beautifulsoup(markup,'html.parser')
这就代表使用的是beautifulsoup库中系统自带的解析器html.parser嘛，那然后他的那个markup是啥
为何我看爬虫书上的markup变成了一个定义的名字.text，然后我自己修改一下就报错

986244073 发表于 2019-9-18 21:58

第一个参数是传解析的文本第二个是解析方式

小楠发表于 2019-9-18 21:59

要不你这样写？
response = requests.get('http://bj.xiaozhu.com/').text

soup = BeautifulSoup(resp,'html.parser')

吧唧小脆脆 发表于 2019-9-18 22:02

小楠发表于 2019-9-18 21:59
要不你这样写？
response = requests.get('http://bj.xiaozhu.com/').text

懂了，就是没有为什么，反正加上text 就对了是吗

柒渡发表于 2019-9-19 09:34

吧唧小脆脆发表于 2019-9-18 22:02
懂了，就是没有为什么，反正加上text 就对了是吗

text是获取文本，你要不先往前补补基础

standyy 发表于 2019-9-20 01:14

看上去像是崔大的书啊。

yth492300648 发表于 2019-9-27 17:53

别看书用xpath

黑黑黑猪儿 发表于 2019-10-1 17:42

你可以看一下requests库返回的response对象有哪些常用方法,text只是其中的一种, 根据需要来选择, 去看requests库的文档

timsxh 发表于 2019-10-12 18:10

美汤不美，请用 xpath

页: [1]

吾爱破解 - 52pojie.cn's Archiver

Python 的BeautifulSoup库求助！