[Python] 某轻小说下载器
本帖最后由 Ki_Yo_Mi 于 2024-1-25 11:20 编辑某轻小说下载器
由于网站提供的下载只有 UMD、JAR 和 全本 下载并不能分卷、章下载,并且插图也没有提供一键下载
于是我就写了一个简单的爬虫提供根据卷、章下载小说,并且可以自动爬取所有插图的脚本
食用方法:
先打开该轻小说网站,由于搜索功能需要登录,所以还请麻烦登录/注册一下
网站关闭通知我认为是个摆设,因为这个网站依然在正常运作,并且我在看的连载小说也在更新中!
大家可以无视该通知,直接注册、登录!
然后通过搜索等方法打开某一个小说详情页
此时你的链接将会是这样:
https://www.wenku8.net/book/[小说ID].htm
但这还不够,由于我多次测试发现目录链接中有一个参数并不固定
所以还请进一步获取该参数,才能继续下载
点击 “小说目录” 链接,
你将会跳转到小说目录页,此时就可以将链接里:
https://www.wenku8.net/novel/[这一部分]/index.htm
中的那一部分填入 Python 脚本最开始要求输入的内容了
下载使用多线程,不太清楚这个特性在 Python 几出来的,但我测试使用的是 Python 3.10 版本
已知 Python 3.12 版本有个不明为何的特性导致多线程创建失败,所以请使用低于 Python 3.12 版本的 Python
程序运行结束即为小说下载完成,可以翻看一下输出日志有没有报错,如果有无法解决的错误欢迎反馈!
只是一个简单的爬虫程序,有哪里写的不好的欢迎大家指正,谢谢!
运行截图:
谢谢楼主 lianghaijian 发表于 2024-2-20 13:23
为啥我打开是这样的?
感谢每一位朋友的支持,希望我们有缘再相聚。
每个网站都是放在服务器上面的,每个服务器都有流量限制,这样下载超出了正常的网站游览的流量。超额的下载流量,对服务器产生了巨大的负载。简单点说就是赚1元,赔5元,甚至赔10-20元,就是这样状态。网站最怕采集和这种利用路径下载的情况。可以说这个网站被玩垮了,建设一个网站需要付出很多精力和后期的维护,就这样被玩垮了,实在可惜啊。 必须点个赞
这个网站能打开? iknew 发表于 2024-1-24 18:58
这个网站能打开?
现在可以了,刚才粘贴链接不知道为什么会变成普通文本
必须点个赞 感谢分享 学习了,感谢分享 楼主无私,哈哈。 这个必须支持,为无私的楼主点赞,感谢分享