Ki_Yo_Mi 发表于 2024-1-24 18:47

[Python] 某轻小说下载器

本帖最后由 Ki_Yo_Mi 于 2024-1-25 11:20 编辑

某轻小说下载器


由于网站提供的下载只有 UMD、JAR 和 全本 下载并不能分卷、章下载,并且插图也没有提供一键下载
于是我就写了一个简单的爬虫提供根据卷、章下载小说,并且可以自动爬取所有插图的脚本


食用方法:

先打开该轻小说网站,由于搜索功能需要登录,所以还请麻烦登录/注册一下


网站关闭通知我认为是个摆设,因为这个网站依然在正常运作,并且我在看的连载小说也在更新中!
大家可以无视该通知,直接注册、登录!

然后通过搜索等方法打开某一个小说详情页
此时你的链接将会是这样:
https://www.wenku8.net/book/[小说ID].htm

但这还不够,由于我多次测试发现目录链接中有一个参数并不固定
所以还请进一步获取该参数,才能继续下载

点击 “小说目录” 链接,
你将会跳转到小说目录页,此时就可以将链接里:
https://www.wenku8.net/novel/[这一部分]/index.htm

中的那一部分填入 Python 脚本最开始要求输入的内容了

下载使用多线程,不太清楚这个特性在 Python 几出来的,但我测试使用的是 Python 3.10 版本
已知 Python 3.12 版本有个不明为何的特性导致多线程创建失败,所以请使用低于 Python 3.12 版本的 Python

程序运行结束即为小说下载完成,可以翻看一下输出日志有没有报错,如果有无法解决的错误欢迎反馈!

只是一个简单的爬虫程序,有哪里写的不好的欢迎大家指正,谢谢!

运行截图:


只看楼主 发表于 2024-1-24 18:57

谢谢楼主

qinni8513 发表于 2024-2-24 17:57

lianghaijian 发表于 2024-2-20 13:23
为啥我打开是这样的?

感谢每一位朋友的支持,希望我们有缘再相聚。


每个网站都是放在服务器上面的,每个服务器都有流量限制,这样下载超出了正常的网站游览的流量。超额的下载流量,对服务器产生了巨大的负载。简单点说就是赚1元,赔5元,甚至赔10-20元,就是这样状态。网站最怕采集和这种利用路径下载的情况。可以说这个网站被玩垮了,建设一个网站需要付出很多精力和后期的维护,就这样被玩垮了,实在可惜啊。

nitian0963 发表于 2024-1-24 18:51

必须点个赞

iknew 发表于 2024-1-24 18:58

这个网站能打开?

Ki_Yo_Mi 发表于 2024-1-24 19:14

iknew 发表于 2024-1-24 18:58
这个网站能打开?

现在可以了,刚才粘贴链接不知道为什么会变成普通文本

邹宝文 发表于 2024-1-24 20:38


必须点个赞

w261514701 发表于 2024-1-24 20:42

感谢分享

zhangxiaoxiao 发表于 2024-1-24 20:45

学习了,感谢分享

wuchuanyuan 发表于 2024-1-24 20:46

楼主无私,哈哈。

xiaolala008 发表于 2024-1-24 22:27

这个必须支持,为无私的楼主点赞,感谢分享
页: [1] 2 3 4 5
查看完整版本: [Python] 某轻小说下载器