好友
阅读权限20
听众
最后登录1970-1-1
|
闲来无事,不想学C++了。听说最近流行的python很火,研究一下。
顺手将小说抓取完善一下。源码列在下面了。需要的自行整理吧。很简单,也就不做说明了。
觉得有用的,给个免费的热心值支持一下吧。
from urllib.request import urlopen
myurl = 'https://www.zwdu.com/book/31855/'
myhost = myurl[0:myurl.find("/",10)]
f = open('d:/text.txt','w+',encoding='gbk')
smsg = urlopen(myurl).read().decode('gbk')
tmsg = smsg.find("<dd>")
while tmsg > 0:
t = smsg[tmsg:smsg.find("</dd>",tmsg)]
smsg = smsg[smsg.find("</dd>",tmsg):]
tmsg = smsg.find("<dd>")
chapurl = myhost + t[t.find("\"") + 1 : t.find("\"",t.find("\"") + 2)]
chapname = t[t.find("\">")+2:t.find("</a>",t.find("\">")+6)]+"\n"
temp = urlopen(chapurl).read().decode('gbk')
content = temp[temp.find("<div id=\"content\">")+18:temp.find("</div>",temp.find("<div id=\"content\">")+20)] + "\n"
content = content.replace("\t","")
content = content.replace("<br />","\n")
f.write(chapname)
f.write(content)
f.close()
|
免费评分
-
参与人数 1 | 吾爱币 +1 |
热心值 +1 |
收起
理由
|
不是童画
| + 1 |
+ 1 |
https://www.52pojie.cn/thread-1437556-1-1.html帮我看看这个。谢谢 |
查看全部评分
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|