[Python] 某轻小说下载器

Ki_Yo_Mi 发表于 2024-1-24 18:47

本帖最后由 Ki_Yo_Mi 于 2024-1-25 11:20 编辑

某轻小说下载器

由于网站提供的下载只有 UMD、JAR 和全本下载并不能分卷、章下载，并且插图也没有提供一键下载
于是我就写了一个简单的爬虫提供根据卷、章下载小说，并且可以自动爬取所有插图的脚本

食用方法：

先打开该轻小说网站，由于搜索功能需要登录，所以还请麻烦登录/注册一下

网站关闭通知我认为是个摆设，因为这个网站依然在正常运作，并且我在看的连载小说也在更新中！
大家可以无视该通知，直接注册、登录！

然后通过搜索等方法打开某一个小说详情页
此时你的链接将会是这样：
https://www.wenku8.net/book/[小说ID].htm

但这还不够，由于我多次测试发现目录链接中有一个参数并不固定
所以还请进一步获取该参数，才能继续下载

点击 “小说目录” 链接，
你将会跳转到小说目录页，此时就可以将链接里：
https://www.wenku8.net/novel/[这一部分]/index.htm

中的那一部分填入 Python 脚本最开始要求输入的内容了

下载使用多线程，不太清楚这个特性在 Python 几出来的，但我测试使用的是 Python 3.10 版本
已知 Python 3.12 版本有个不明为何的特性导致多线程创建失败，所以请使用低于 Python 3.12 版本的 Python

程序运行结束即为小说下载完成，可以翻看一下输出日志有没有报错，如果有无法解决的错误欢迎反馈！

只是一个简单的爬虫程序，有哪里写的不好的欢迎大家指正，谢谢！

运行截图：

只看楼主 发表于 2024-1-24 18:57

谢谢楼主

qinni8513 发表于 2024-2-24 17:57

lianghaijian 发表于 2024-2-20 13:23
为啥我打开是这样的？

感谢每一位朋友的支持，希望我们有缘再相聚。

每个网站都是放在服务器上面的，每个服务器都有流量限制，这样下载超出了正常的网站游览的流量。超额的下载流量，对服务器产生了巨大的负载。简单点说就是赚1元，赔5元，甚至赔10-20元，就是这样状态。网站最怕采集和这种利用路径下载的情况。可以说这个网站被玩垮了，建设一个网站需要付出很多精力和后期的维护，就这样被玩垮了，实在可惜啊。

nitian0963 发表于 2024-1-24 18:51

必须点个赞

iknew 发表于 2024-1-24 18:58

这个网站能打开？

Ki_Yo_Mi 发表于 2024-1-24 19:14

iknew 发表于 2024-1-24 18:58
这个网站能打开？

现在可以了，刚才粘贴链接不知道为什么会变成普通文本

邹宝文 发表于 2024-1-24 20:38

必须点个赞

w261514701 发表于 2024-1-24 20:42

感谢分享

zhangxiaoxiao 发表于 2024-1-24 20:45

学习了，感谢分享

wuchuanyuan 发表于 2024-1-24 20:46

楼主无私，哈哈。

xiaolala008 发表于 2024-1-24 22:27

这个必须支持，为无私的楼主点赞，感谢分享

页: [1] 2 3 4 5

吾爱破解 - 52pojie.cn's Archiver

[Python] 某轻小说下载器