吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 13672|回复: 86
上一主题 下一主题
收起左侧

[Windows] 批量将下载的公众号文章html转pdf,合并pdf文件

    [复制链接]
跳转到指定楼层
楼主
susheng 发表于 2022-12-8 21:42 回帖奖励
最近用python写了个html转换工具html2pdf.exe https://wwk.lanzouf.com/iSpV90fbtpqh   ,代码如下:
[Asm] 纯文本查看 复制代码
def to_pdf():
    import pdfkit
    htmls = []
    for root, dirs, files in os.walk('.'):
     for name in files:
      if name.endswith(".html"):
       print(name)
       try:
        pdfkit.from_file(name, 'pdf/'+name.replace('.html', '')+'.pdf')
       except Exception as e:
        print(e)

工具依赖wkhtmltopdf,先从https://wkhtmltopdf.org/downloads.html 下载,然后将wkhtmltopdf.exe加入环境变量,直接运行html2pdf.exe,导出的pdf文件在pdf目录:


然后用这个pdf合并工具 https://wwn.lanzouf.com/irAGD089czyj 将所有pdf合成一个文件,比如我将莫言老师的所有文章合成了一个pdf文件,看文章方便多了:





免费评分

参与人数 28吾爱币 +25 热心值 +20 收起 理由
划痕的CD + 1 + 1 劝退 Python 的配置,需要安装 pdfkit 库,用这个指令链接到存放在本地.
大毛猪Cool + 1 + 1 作者你好,这个加入环境变量后为什么转换成PDF还是为空啊?
cwyztlk + 1 + 1 谢谢@Thanks!
Mahuajie + 1 我很赞同!
windpeaceflowe + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
minpp_52 + 1 谢谢@Thanks!
菠萝2021 + 1 谢谢@Thanks!
yszx + 1 热心回复!
decai + 1 + 1 谢谢@Thanks!
mfksse001 + 1 + 1 我很赞同!
zerotwoking2 + 1 用心讨论,共获提升!
zpp123 + 1 + 1 我很赞同!
woxobo + 1 + 1 谢谢@Thanks!
DaiTian + 1 + 1 谢谢 @Thanks!
leeofwar + 1 + 1 谢谢@Thanks!
cbkxh + 1 我很赞同!
wa00000 + 1 + 1 我很赞同!
Codeman + 1 + 1 我很赞同!
Miren13 + 1 我很赞同!
抱薪风雪雾 + 1 + 1 谢谢@Thanks!
2020抢房计划 + 1 + 1 谢谢@Thanks!
meilidemm + 1 我很赞同!
JinxBoy + 1 谢谢@Thanks!
dogox + 1 + 1 我很赞同!
zpzwz + 1 + 1 用心讨论,共获提升!
hababy777 + 1 谢谢@Thanks!
laonanhai945 + 1 + 1 谢谢@Thanks!
shane2021 + 1 + 1 热心回复!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

来自 #
 楼主| susheng 发表于 2022-12-10 14:46 |楼主
zhousong21 发表于 2022-12-10 11:52
谢谢分享,不过这跟CTRL+P比,有啥区别?

批量啊,几百篇文章怎么ctrl+p
推荐
chaoxu680 发表于 2022-12-9 10:06
推荐
ZMC0635 发表于 2022-12-8 23:21
按步骤来做了,但是打开第一个exe程序就闪退了。

免费评分

参与人数 1热心值 +1 收起 理由
cnzjqz + 1 我也是

查看全部评分

推荐
cbkxh 发表于 2022-12-9 05:06
网页上图片较多时,加载有延迟的所有图片,转成Pdf后,图片都无法显示,不知如何解决
推荐
无敌小儿 发表于 2022-12-9 09:10
acecttgd 发表于 2022-12-9 08:44
听说有个软件可以在线收藏的,好象是什么笔记。功能差不多吧

为知笔记吧
推荐
aocun 发表于 2022-12-8 23:52
那应该如何下载下载公众号文章呢?
3#
tianyagd 发表于 2022-12-8 21:56
本帖最后由 tianyagd 于 2022-12-8 21:58 编辑

这个可以有,可以单独现在某一篇,也可以批量下载。我在CSDN下载就用过这种方法
4#
diaoshuai 发表于 2022-12-8 22:05
好东西,值得收藏
5#
lzs105 发表于 2022-12-8 22:22
感谢楼主分享
6#
yuanleifke 发表于 2022-12-8 22:35
谢谢楼主
7#
skygardon 发表于 2022-12-8 22:40
非常好的分享,把软件wkhtmltopdf.exe加入环境变量有什么需要注意的吗?
8#
lsy832 发表于 2022-12-8 22:56
谢谢楼主的分享
9#
Nuanse80 发表于 2022-12-8 23:39
收藏了,感谢楼主分享。我还需要好好钻研一下
10#
超逸绝尘 发表于 2022-12-8 23:48
这个我感觉还是蛮好的。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-4 15:06

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表