好友
阅读权限10
听众
最后登录1970-1-1
|
本帖最后由 lanzifei 于 2020-12-19 15:38 编辑
求助,标题1不存在为空时,怎么用标题2代替,然后保存
标题1报错的原因是有的页面没有这个标签
fp = open('./1.txt', 'w', encoding='utf-8')
for li in li_list:
# title = li.a.string
detail_url = '#' + li['href']
# print(detail_url)
# 对详情页发起请求,解析出章节内容
detail_page_text = requests.get(url=detail_url, headers=headers).text
# 解析出详情页中相关的章节内容
detail_soup = BeautifulSoup(detail_page_text, 'lxml')
div_tag1 = detail_soup.find('h2', class_='title').text #标题1
div_tag2 = detail_soup.find('h1', class_='title').text #标题2
div_bianhao = detail_soup.find('h3', id="gallery_id").text #编号
# 解析到了章节的内容
fp.write(div_bianhao + ' : ' + div_tag1 + ' : ' + '\n')
print(div_bianhao, '爬取成功!!!')
#报错div_tag1 = detail_soup.find('h2', class_='title').text #标题1AttributeError: 'NoneType' object has no attribute 'text'
搞不懂0.0
|
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|