使用Python下载云展网的电子书并合成PDF
本帖最后由 Kenny0521 于 2022-4-15 14:38 编辑新人第一次发帖,有误望海涵,谢谢
最近宅在家,没事干,就想看看书。我发现云展网的书挺好,就想下载下来慢慢看,但有的书不开放下载,于是决定自己动手。
打开DevTools,点开网络,随便翻一页电子书,发现文件有规律:
第一页: https://book.yunzhan365.com/pxdi/zwek/files/large/1.jpg
第二页: https://book.yunzhan365.com/pxdi/zwek/files/large/2.jpg
发现第n页的网址:https://book.yunzhan365.com/pxdi/zwek/files/large/n.jpg
https://book.yunzhan365.com/pxdi/zwek/files/large/n.jpg
于是随便写了一点Python的爬虫(用了requests)
https://s1.ax1x.com/2022/04/15/L8EFaD.png (下载后的效果)
但是下载的是一页一页的图片,如果想要合成PDF,还需要Python的帮忙,这里推荐https://www.jb51.net/article/153918.htm这篇文章。 这会有事做了 用python也是可以一次合成pdf的哦 PDF_Shaper_Professional_v9.7单文件 把图片转为pdf 可以实现自动化的一次打包好,不然还得二次操作
叫我小王叔叔 发表于 2022-4-15 14:05
用python也是可以一次合成pdf的哦
已改正,感谢提出错误! 这个实现思路还是不错的。 我也去这个网站看看! 感谢分享,这个还是很不错的! 有个app叫
博看书苑
里面杂志忒多
输入图书馆代码
就都可以看
高清