吧唧小脆脆 发表于 2019-9-18 21:23

Python 的BeautifulSoup库求助!

就用beautifulsoup来解析数据的时候
一般是这样写:soup = beautifulsoup(markup,'html.parser')
这就代表使用的是beautifulsoup库中系统自带的解析器html.parser嘛,那然后他的那个markup是啥
为何我看爬虫书上的markup变成了一个    定义的名字.text,然后我自己修改一下就报错

986244073 发表于 2019-9-18 21:58

第一个参数是传解析的文本 第二个是解析方式

小楠 发表于 2019-9-18 21:59

要不你这样写?
response = requests.get('http://bj.xiaozhu.com/').text

soup = BeautifulSoup(resp,'html.parser')

吧唧小脆脆 发表于 2019-9-18 22:02

小楠 发表于 2019-9-18 21:59
要不你这样写?
response = requests.get('http://bj.xiaozhu.com/').text



懂了,就是没有为什么,反正加上text 就对了是吗

柒渡 发表于 2019-9-19 09:34

吧唧小脆脆 发表于 2019-9-18 22:02
懂了,就是没有为什么,反正加上text 就对了是吗

text是获取文本,你要不先往前补补基础

standyy 发表于 2019-9-20 01:14

看上去像是崔大的书啊。

yth492300648 发表于 2019-9-27 17:53

别看书 用xpath

黑黑黑猪儿 发表于 2019-10-1 17:42

你可以看一下requests库返回的response对象有哪些常用方法,text只是其中的一种, 根据需要来选择, 去看requests库的文档

timsxh 发表于 2019-10-12 18:10

美汤不美,请用 xpath
页: [1]
查看完整版本: Python 的BeautifulSoup库求助!