本帖最后由 Ki_Yo_Mi 于 2024-1-25 11:20 编辑
某轻小说下载器
由于网站提供的下载只有 UMD、JAR 和 全本 下载并不能分卷、章下载,并且插图也没有提供一键下载
于是我就写了一个简单的爬虫提供根据卷、章下载小说,并且可以自动爬取所有插图的脚本
食用方法:
先打开该轻小说网站,由于搜索功能需要登录,所以还请麻烦登录/注册一下
网站关闭通知我认为是个摆设,因为这个网站依然在正常运作,并且我在看的连载小说也在更新中!
大家可以无视该通知,直接注册、登录!
然后通过搜索等方法打开某一个小说详情页
此时你的链接将会是这样:
[Asm] 纯文本查看 复制代码 https://www.wenku8.net/book/[小说ID].htm
但这还不够,由于我多次测试发现目录链接中有一个参数并不固定
所以还请进一步获取该参数,才能继续下载
点击 “小说目录” 链接,
你将会跳转到小说目录页,此时就可以将链接里:
[Asm] 纯文本查看 复制代码 https://www.wenku8.net/novel/[这一部分]/index.htm
中的那一部分填入 Python 脚本最开始要求输入的内容了
下载使用多线程,不太清楚这个特性在 Python 几出来的,但我测试使用的是 Python 3.10 版本
已知 Python 3.12 版本有个不明为何的特性导致多线程创建失败,所以请使用低于 Python 3.12 版本的 Python
程序运行结束即为小说下载完成,可以翻看一下输出日志有没有报错,如果有无法解决的错误欢迎反馈!
只是一个简单的爬虫程序,有哪里写的不好的欢迎大家指正,谢谢!
运行截图:
轻小说文库下载.zip
(2.05 KB, 下载次数: 365)
|