吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 44374|回复: 592
收起左侧

[原创工具] 小说下载利器

    [复制链接]
事燃cs释然 发表于 2020-9-11 08:07
本帖最后由 事燃cs释然 于 2021-7-18 20:03 编辑

小说下载器,新增直接下载网络完本小说功能
功能一:直接搜索完整txt文件下载
功能二:将只能在线观看的小说爬取成为txt文件
说一下两个方式的优缺点:
直接下载:
【优点】下载速度快
【缺点】一般只会搜集已完本且人气较高的小说,所以有的小说找不到
网站爬取:
【优点】涵盖范围广,一般只要已经上架的小说都可以找到
【缺点】下载速度慢,因为需要从网站中一章章爬取然后保存
目前支持的网站:
http://www.xbiquge.la/
http://www.biquge.info/
http://www.ikuaiyan.com/
http://www.booksky.cc/
https://www.9biquge.com/
http://www.jjwxc.net/
https://www.taiuu.com/
https://www.shouda8.com/
https://www.13800100.com/
http://www.31xs.com/
http://www.52ggd.com/
https://www.fushucun.com/
http://www.dusuu.com/

等待建议......
需要添加源可在评论区告诉我
注:如果有什么建议最好是在评论区发,因为评分区的话大部分都是系统自带的那几句话,我一般不会怎么去关注,我也是刚闲着没事翻一翻才发现的有好几个用户的添加建议的...,当然如果可以的话在评分区留下一个印记也是很不错的
话不多说,上链接:
蓝奏云:https://wws.lanzoui.com/imxf7n5ajtg

说一下怎么使用:
程序运行方法:解压,双击“小说下载器.exe
小说目录页是这样的页面:
image.png
附上软件截图(左右两边为独立的两个功能区,互不干涉):
image.png

注:因为本程序会向电脑中保存一个小说的txt文件,所以有可能会被杀毒软件报毒


2020/9/11 15:10 第一次更新:当某章节只有一两行文本时,正则表达式无法匹配
2020/9/12 16:32 第二次更新:如果保存的是已经保存一次的小说,会从上一次保存的基础上保存,防止浪费时间
2020/9/13 17:02 第三次更新:每保存一章就会及时保存json,这样如果程序在运行期间被关闭或中断,下次爬取同一个小说是会自动识别已保存记录继续保存
2020/9/18 20:48 重大更新:重新排版代码,在保留以前功能的前提下,优化运行速度,添加规则模块方便以后添加解析规则,提示信息更加人性化
2020/9/19 16:33 新增解析:http://www.ikuaiyan.com/     http://www.booksky.cc/
2020/9/19 20::47 新增解析:https://www.9biquge.com/
2020/9/13 17:02 第四次更新:修复如果遇到空章节会一直卡在这个章节的bug,新增晋江文学城免费小说解析 http://www.jjwxc.net/
2020/9/18 20:48 重大更新:新增直接搜索下载完整txt文件功能,速度大大提升
2020/9/25 19:48 新增解析:https://www.shouda8.com/
2020/9/27 21:40 第五次更新:修复http://www.ikuaiyan.com/网站解析的bug
2020/9/28 23:42 第六次更新:修复http://www.jjwxc.net/网站解析的bug
2020/10/12 21:07 第七次更新:新增功能,若保存已存小说可选择与之前保存内容分离保存
2020/10/24 20:29 新增解析:https://www.13800100.com/  http://www.31xs.com/   http://www.52ggd.com/

2021/1/10 20:59 超重大更新:完全重写代码,使用GUI界面为主体,使界面更具备可读性,新增解析https://www.fushucun.com/
2021/1/12 18:21 新增32位版本
2021/1/25 18:31 新增解析:http://www.dusuu.com/
2021/2/5 8:39 修改解析:http://www.paoshuzw.com/, 删除本地rules文件改为网络获取,之后规则更新在网络中修改即可,无需重复下载
2021/2/25 11:39 修复因小说标题不合法导致文件无法保存的bug
2021/3/8 19:51 修复因采集网站规则改变引起的bug

如果大家有什么意见希望可以提一下,又或者想要添加哪个网站的解析也可以说一声,我想尽可能把这个项目写好,谢谢大家的支持!!!

免费评分

参与人数 175吾爱币 +168 热心值 +156 收起 理由
俊宏 + 1 我很赞同!
腰围两尺99 + 1 + 1 出个视频教学怎么做
sxdmo + 1 + 1 大佬可以添加https://www.xbiquge.me吗,感谢感谢
lin2007235 + 1 谢谢@Thanks!
easilyy + 1 + 1 谢谢@Thanks!
甜筒不甜 + 1 + 1 我很赞同!
我爱栗子 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
转向灯 + 1 + 1 我很赞同!
阿迦南 + 1 + 1 我很赞同!
Shuimu + 1 + 1 我很赞同!
weijie689 + 1 + 1 谢谢@Thanks!
panjj_5 + 1 + 1 谢谢@Thanks!
批注 + 2 + 1 全给你
zengyijun + 1 + 1 我很赞同!
hdksf1982 + 1 + 1 谢谢@Thanks!
xxx5989460 + 1 + 1 谢谢@Thanks!
cocer + 1 + 1 谢谢@Thanks!
skbaleno + 1 + 1 谢谢@Thanks!
银狐狸 + 1 + 1 我很赞同!
KERNELKANG + 1 + 1 我很赞同!
仓佑加错 + 1 + 1 我很赞同!
yingwuqing + 1 + 1 不知为何没人做一款电脑版的阅读呢?老人看书用手机字太小,习惯用电脑看小.
lm1990 + 1 + 1 我很赞同!
renhwfd + 1 + 1 我很赞同!
losic + 1 + 1 用心讨论,共获提升!
lin10001 + 1 谢谢@Thanks!
paopao900 + 1 + 1 大佬请添加网站,http://www.bookbao.me , https://m.baoshuu.com/book/.
wuyuanhong + 1 + 1 谢谢@Thanks!
yuwoo + 1 + 1 谢谢@Thanks!
skwt + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
ayuterry + 1 我很赞同!
wjh8516 + 1 + 1 谢谢@Thanks!
Jaxiy + 1 + 1 谢谢@Thanks!
yushui224 + 1 + 1 谢谢@Thanks!
747903893 + 1 + 1 爬的不算慢,但是为啥整本下载速度经常为0呢?
yuangencai + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
AaronSs + 1 + 1 我很赞同!
angelbaby999 + 1 + 1 谢谢@Thanks!
netgiant + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
时光静迁oVo + 1 + 1 热心回复!
nesser555 + 1 + 1 谢谢@Thanks!
mf_yanyan + 1 + 1 好东西,感谢
晚风811 + 1 + 1 我很赞同!
cjc3528 + 1 我很赞同!
痞笑的二哈 + 1 + 1 谢谢大佬~
lfdw123 + 1 + 1 谢谢@Thanks!
zhzng + 1 + 1 谢谢@Thanks!
ahfyt + 1 + 1 谢谢@Thanks!
fqfawsy + 1 + 1 我很赞同!
Gowdy + 1 + 1 大哥,继续更新好吧
ToddZHeng + 1 + 1 谢谢@Thanks!
roywangqian + 1 + 1 谢谢@Thanks!
fyz2007 + 1 + 1 谢谢@Thanks!
xqsquare + 1 + 1 谢谢@Thanks!
aaa_zhang + 1 + 1 鼓励转贴优秀软件安全工具和文档!
zzgwyyx + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
syclone + 1 + 1 谢谢@Thanks!
arklw + 1 + 1 热心回复!
zhan23x + 1 鼓励转贴优秀软件安全工具和文档!
忘了… + 1 + 1 谢谢@Thanks!
还没②够 + 1 谢谢@Thanks!
萌新小鲨鱼 + 1 + 1 谢谢@Thanks!
stars星空 + 1 + 1 我很赞同!
feifeix3384 + 1 + 1 谢谢@Thanks!
yllyk + 1 + 1 我很赞同!
newtalan + 1 + 1 谢谢@Thanks!
hcoolsky + 1 + 1 谢谢@Thanks!
mactaod + 1 + 1 热心回复!
alias318 + 1 谢谢@Thanks!
不是吧不是吧 + 1 求大佬增加https://www.fyxfcw.com/
红雨飘飘 + 1 + 1 我很赞同!
whw3222 + 1 + 1 谢谢@Thanks!
白羽黑 + 1 + 1 谢谢@Thanks!
3633283 + 1 + 1 大佬,可否加入qidian限免?
lintaowww + 1 --------作为一名军事爱好者,不知道能添加铁血 吗?知名军事板块啊,谢谢.
wuwekey + 1 + 1 我很赞同!
zjbluo + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
rlfengtang + 1 + 1 这个网站可以加一下,https://www.du00.com/
hl532 + 1 + 1 我很赞同!
baybayle + 1 + 1 谢谢@Thanks!
luo777 + 1 + 1 我很赞同!
cneac + 1 + 1 大佬加下http://www.31xs.com/ http://www.52ggd.com/ http://www.fenghuaj.
jnzj4811 + 1 + 1 谢谢@Thanks!
BigMonMon + 1 + 1 热心回复!
青白苦菜 + 1 + 1 谢谢@Thanks!
汐故辞 + 1 热心回复!
落叶梧桐 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
maga + 1 谢谢@Thanks!
lamkkl + 1 + 1 鼓励转贴优秀软件安全工具和文档!
zyydhk + 1 我很赞同!
金板桥 + 1 + 1 谢谢@Thanks!
PSG.LGD.fygod + 1 + 1 我很赞同!
寂默天才 + 1 + 1 谢谢@Thanks!
大圣美工设计翟 + 1 + 1 谢谢很好用
K20200721 + 1 找好久了,试一试
大酒鬼 + 1 + 1 http://www.ihuaben.com/book/4879639.html?hmsr=share-ihuaben-2524928这.
q7634356 + 1 + 1 谢谢@Thanks!
batman2333 + 1 + 1 热心回复!
aiwo4087 + 1 + 1 谢谢@Thanks!
斯格拉默 + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 事燃cs释然 发表于 2020-9-29 21:19
本帖最后由 事燃cs释然 于 2020-9-29 21:22 编辑
wasd84562 发表于 2020-9-29 15:41
有一点点java C语言基础 我想学一下自己加网站源下载 可以简单讲解一下吗

要添加规则其实也不是太难
你首先得至少会一点xpath语法,我给你找了个教程:https://b23.tv/pYPsFY 基本看了这个就差不多了,
然后你既然懂得其他语言,那应该也懂得json,而规则就写在dist文件夹中的rules.json里面,将这个文件整理后,你会发现它的每一个项目的格式都是这样的:
"biquge": {
"title": "//div[@id=\"list\"]//dd//text()",
"urlList": "//div[@id=\"list\"]//dd/a/@href",
"book_name": "//div[@id=\"info\"]//h1/text()",
"realm": "",
"chapter": "//div[@id=\"content\"]/text()",
"code": "utf-8"
}

"biquge"是小说网站的域名,比如http://www.jjwxc.net/就是“jjwxc”
“title”章节名称
“urlList”章节内容页面链接
“book_name”书名

“realm”这个应该叫链接起始位置吧,功能是用来补全链接的,这个就要看a链接的href属性里的值,指向章节内容页的a标签中的URL如果从根目录开始算的就直接填写域名,如果是从当前位置开始算的就直接空就好,给你举个例吧,这样说估计也看不懂:
比如笔趣阁:
它的a标签是这样的
<a href="/10/10489/4534454.html">写在连载前</a>
如果它要打开一内容页,那么它要填充的就是http://www.xbiquge.la/,来组成完整的链接:http://www.xbiquge.la/10/10489/4534454.html,这也就是从根目录开始算;
但如果它是这样<a href="/4534454.html">写在连载前</a>
如果它要打开一内容页,那么它要填充的就是http://www.xbiquge.la/10/10489/,其中/10/10489/是小说目录页的所在链接,这就是从当前位置开始算,这种情况下就填空就好,因为我在程序里如果遇到空就会自动填写目录页链接

“chapter”是文章内容页的文本内容
“code”是该网页的编码格式,可以在HTML里的<meta>标签里看到,比如笔趣阁就是这样的:<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

对了,最后补一句,你看到的 "//div[@id=\"list\"]//dd/a/@href",之所以有\"是因为在json中的转义问题,所以你如果用双引号也要写\用于转义
好了,就这些了,如果还有什么问题,欢迎继续来问我

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
limit7 + 1 + 1 授人以渔

查看全部评分

 楼主| 事燃cs释然 发表于 2021-3-8 19:53
银翼游侠 发表于 2021-3-8 13:36
可以可以,感谢分享,就是为啥搜全部点下载没反应?

感谢提醒,发现一个bug
主要是因为网站规则改变了导致爬取不到链接,已经更新了,重新下载就可以使用了
干掉婊子 发表于 2020-9-11 08:56
武士365 发表于 2021-2-10 15:21
www.paoshuzw.com不行,还是得手动输入xbiquge.la,请大佬看看咋回事
头像被屏蔽
噼哩叭啦蹦 发表于 2020-9-11 08:08
提示: 作者被禁止或删除 内容自动屏蔽
Zz6103162 发表于 2020-9-11 08:12
感谢原创分享,试用一下。
精于勤 发表于 2020-9-11 08:17
路过打酱油
tea456 发表于 2020-9-11 08:21
谢谢分享,十分感谢
我傻瓜1991 发表于 2020-9-11 08:28
实用的小程序
张起灵夫人 发表于 2020-9-11 08:45
哇 感谢分享!
小七先森 发表于 2020-9-11 08:54
现在都是手机在线看,感谢分享
cyl279 发表于 2020-9-11 09:15
实用的小程序
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 03:33

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表