使用Python下载云展网的电子书并合成PDF

Kenny0521 发表于 2022-4-15 13:47

本帖最后由 Kenny0521 于 2022-4-15 14:38 编辑

新人第一次发帖，有误望海涵，谢谢
最近宅在家，没事干，就想看看书。我发现云展网的书挺好，就想下载下来慢慢看，但有的书不开放下载，于是决定自己动手。
打开DevTools，点开网络，随便翻一页电子书，发现文件有规律:
第一页: https://book.yunzhan365.com/pxdi/zwek/files/large/1.jpg
第二页: https://book.yunzhan365.com/pxdi/zwek/files/large/2.jpg
发现第n页的网址：https://book.yunzhan365.com/pxdi/zwek/files/large/n.jpg
https://book.yunzhan365.com/pxdi/zwek/files/large/n.jpg
于是随便写了一点Python的爬虫（用了requests）
https://s1.ax1x.com/2022/04/15/L8EFaD.png （下载后的效果）
但是下载的是一页一页的图片，如果想要合成PDF，还需要Python的帮忙，这里推荐https://www.jb51.net/article/153918.htm这篇文章。

woainiaiwo 发表于 2022-4-15 13:54

这会有事做了

叫我小王叔叔 发表于 2022-4-15 14:05

用python也是可以一次合成pdf的哦

狂笑一君 发表于 2022-4-15 14:12

PDF_Shaper_Professional_v9.7单文件把图片转为pdf

layuai 发表于 2022-4-15 14:13

可以实现自动化的一次打包好，不然还得二次操作

Kenny0521 发表于 2022-4-15 14:38

叫我小王叔叔发表于 2022-4-15 14:05
用python也是可以一次合成pdf的哦

已改正，感谢提出错误！

yuechaomax 发表于 2022-4-15 14:57

这个实现思路还是不错的。

symbolshen 发表于 2022-4-15 15:09

我也去这个网站看看！

大大泡泡糖121 发表于 2022-4-15 15:45

感谢分享，这个还是很不错的！

bydlyzx 发表于 2022-4-15 15:58

有个app叫
博看书苑
里面杂志忒多
输入图书馆代码
就都可以看
高清

页: [1] 2 3 4 5

吾爱破解 - 52pojie.cn's Archiver

使用Python下载云展网的电子书并合成PDF