cdsgg 发表于 2020-12-13 19:38

弘扬中华诗词文化 大家读读古诗吧 新手向爬虫

import requests
from bs4 import BeautifulSoup
import random
import time






for t in range(10):#更改数字即可显示几首诗

        b=random.randint(0,25)#随机一页
        c=random.randint(0,9)#随机一首


        print(f'第{b}页,第{c+1}首')

        url=f'https://www.gushiwen.cn/default_{b}.aspx'



        req=requests.get(url=url).content.decode()

        soup=BeautifulSoup(req,'lxml')

        title=soup.select('div>div>p>a>b')#标题

        contson=soup.select('div>div>div')#诗词内容
        Author=soup.select('div>div>p>a:first-child')#作者
        Dynasty=soup.select('div>div>p>a:nth-child(2)')#朝代


        print(f'{title.text}\n{Author.text}    {Dynasty.text}\n{contson.text}')
        print('***********************************************')
        time.sleep(3)

georgefan 发表于 2021-1-15 09:00

报错!
第6页,第3首
Traceback (most recent call last):
File "C:\FENGDoc\临时文件\funwithpython\worm\gushici.py", line 17, in <module>
    soup = BeautifulSoup(req, 'lxml')
File "C:\FENGDoc\临时文件\funwithpython\venv\lib\site-packages\bs4\__init__.py", line 243, in __init__
    raise FeatureNotFound(
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?

mrliu133 发表于 2020-12-22 13:25

大佬,请教一下,为啥我的sublime text 如法导入如requests这类的第三方模块呢?能否参考一下你的编译系统。我导入第三方模块的时候就报错显示no moudle named XXX
不知道你有没有遇到过类似的问题

qianyi9 发表于 2020-12-13 19:44

感谢楼主的分享,一直很喜欢诗词

60235300 发表于 2020-12-13 19:46

可以哟~~唧唧复唧唧~~

枫叶飞向海 发表于 2020-12-13 20:22

多学习有好处

n3iuarem3t 发表于 2020-12-13 20:31

看来有时间真得搞搞python了

cdsgg 发表于 2020-12-13 20:38

n3iuarem3t 发表于 2020-12-13 20:31
看来有时间真得搞搞python了

入门简单的

你是我的人 发表于 2020-12-13 20:38

感谢楼主,不用自己去找了

cdsgg 发表于 2020-12-13 20:45

你是我的人 发表于 2020-12-13 20:38
感谢楼主,不用自己去找了

找啥               东西的 哈?

jokony 发表于 2020-12-13 20:51

学不起来了。。

觉今是而昨非 发表于 2020-12-13 21:49

领略诗词之美,文明你我大家!
页: [1] 2 3
查看完整版本: 弘扬中华诗词文化 大家读读古诗吧 新手向爬虫