Kenny0521 发表于 2022-4-15 13:47

使用Python下载云展网的电子书并合成PDF

本帖最后由 Kenny0521 于 2022-4-15 14:38 编辑

新人第一次发帖,有误望海涵,谢谢
最近宅在家,没事干,就想看看书。我发现云展网的书挺好,就想下载下来慢慢看,但有的书不开放下载,于是决定自己动手。
打开DevTools,点开网络,随便翻一页电子书,发现文件有规律:
第一页: https://book.yunzhan365.com/pxdi/zwek/files/large/1.jpg
第二页: https://book.yunzhan365.com/pxdi/zwek/files/large/2.jpg
发现第n页的网址:https://book.yunzhan365.com/pxdi/zwek/files/large/n.jpg
https://book.yunzhan365.com/pxdi/zwek/files/large/n.jpg
于是随便写了一点Python的爬虫(用了requests)
https://s1.ax1x.com/2022/04/15/L8EFaD.png (下载后的效果)
但是下载的是一页一页的图片,如果想要合成PDF,还需要Python的帮忙,这里推荐https://www.jb51.net/article/153918.htm这篇文章。

woainiaiwo 发表于 2022-4-15 13:54

这会有事做了

叫我小王叔叔 发表于 2022-4-15 14:05

用python也是可以一次合成pdf的哦

狂笑一君 发表于 2022-4-15 14:12

PDF_Shaper_Professional_v9.7单文件   把图片转为pdf

layuai 发表于 2022-4-15 14:13

可以实现自动化的一次打包好,不然还得二次操作

Kenny0521 发表于 2022-4-15 14:38

叫我小王叔叔 发表于 2022-4-15 14:05
用python也是可以一次合成pdf的哦

已改正,感谢提出错误!

yuechaomax 发表于 2022-4-15 14:57

这个实现思路还是不错的。

symbolshen 发表于 2022-4-15 15:09

我也去这个网站看看!

大大泡泡糖121 发表于 2022-4-15 15:45

感谢分享,这个还是很不错的!

bydlyzx 发表于 2022-4-15 15:58

有个app叫
博看书苑
里面杂志忒多
输入图书馆代码
就都可以看
高清
页: [1] 2 3 4 5
查看完整版本: 使用Python下载云展网的电子书并合成PDF