弘扬中华诗词文化大家读读古诗吧新手向爬虫

cdsgg 发表于 2020-12-13 19:38

import requests
from bs4 import BeautifulSoup
import random
import time

for t in range(10):#更改数字即可显示几首诗

b=random.randint(0,25)#随机一页
c=random.randint(0,9)#随机一首

print(f'第{b}页,第{c+1}首')

url=f'https://www.gushiwen.cn/default_{b}.aspx'

req=requests.get(url=url).content.decode()

soup=BeautifulSoup(req,'lxml')

title=soup.select('div>div>p>a>b')#标题

contson=soup.select('div>div>div')#诗词内容
Author=soup.select('div>div>p>a:first-child')#作者
Dynasty=soup.select('div>div>p>a:nth-child(2)')#朝代

print(f'{title.text}\n{Author.text} {Dynasty.text}\n{contson.text}')
print('***********************************************')
time.sleep(3)

georgefan 发表于 2021-1-15 09:00

报错！
第6页,第3首
Traceback (most recent call last):
File "C:\FENGDoc\临时文件\funwithpython\worm\gushici.py", line 17, in <module>
soup = BeautifulSoup(req, 'lxml')
File "C:\FENGDoc\临时文件\funwithpython\venv\lib\site-packages\bs4\__init__.py", line 243, in __init__
raise FeatureNotFound(
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?

mrliu133 发表于 2020-12-22 13:25

大佬，请教一下，为啥我的sublime text 如法导入如requests这类的第三方模块呢？能否参考一下你的编译系统。我导入第三方模块的时候就报错显示no moudle named XXX
不知道你有没有遇到过类似的问题

qianyi9 发表于 2020-12-13 19:44

感谢楼主的分享，一直很喜欢诗词

60235300 发表于 2020-12-13 19:46

可以哟~~唧唧复唧唧~~

枫叶飞向海 发表于 2020-12-13 20:22

多学习有好处

n3iuarem3t 发表于 2020-12-13 20:31

看来有时间真得搞搞python了

cdsgg 发表于 2020-12-13 20:38

n3iuarem3t 发表于 2020-12-13 20:31
看来有时间真得搞搞python了

入门简单的

你是我的人 发表于 2020-12-13 20:38

感谢楼主，不用自己去找了

cdsgg 发表于 2020-12-13 20:45

你是我的人发表于 2020-12-13 20:38
感谢楼主，不用自己去找了

找啥东西的哈？

jokony 发表于 2020-12-13 20:51

学不起来了。。

觉今是而昨非 发表于 2020-12-13 21:49

领略诗词之美，文明你我大家！

页: [1] 2 3

吾爱破解 - 52pojie.cn's Archiver

弘扬中华诗词文化 大家读读古诗吧 新手向爬虫

弘扬中华诗词文化大家读读古诗吧新手向爬虫