python写个合并pdf的小工具
本帖最后由 Kris_Shin 于 2020-11-5 20:47 编辑pdf合并工具
最近需要合并大量的pdf, 找了几个工具,要么收费,要么不好用,然后就自己写了简单功能的小工具.
特点就是把当前目录及子目录下的所有pdf文件合并成一个merged.pdf (比如你直接放在D盘根目录会把你D盘里面的所有pdf全部合并成一个, 会很占内存和时间)
除了方便打印我也不知道有什么其他的作用, 反正我就是拿来打印的
已知BUG
1. 某些特殊编码的pdf合并会失败(没找到解决办法), 而且也无法确定是哪一个文件---整个文件保存失败也就是完全无法合并
2. 某些pdf会因为不知道什么原因无法读取xref,无法打开--- 解决办法 : 使用浏览器或者其他什么可以打开pdf的程序确定程序可以打开, 然后点击打印, 通过虚拟打印机再保存出来, 就可以修复了.
如果你嫌弃他会输出很多警告信息的话可以去pypdf4包的源码中把那些警告输出注释掉, 具体方法就不讲了, 如果有需要可以私信我
本来想直接上传打包后的exe, 大小超了, 只提供天翼网盘连接:https://cloud.189.cn/t/A73QzqmQRjMz (访问码:kpo0)
写的很简单, 高手勿喷
为大佬提供源码:
import re
from PyPDF4.pdf import PdfFileReader as pr, PdfFileWriter as pw
def MergePDF(dir_path):
pdf_files = list()
merged_file = pw()
for path, _, files in os.walk(dir_path):
pdf_files.extend([os.path.join(path, f)
for f in files if f.lower().endswith('.pdf')])# 遍历当前文件夹下所有pdf文件并组合成相对路径
pdf_files.sort(key=lambda i: int(re.findall(r'(\d+).*?', i)
) if re.findall(r'(\d+).*?', i) else -1)# 按照路径排序(没有数字的在前面, 有数字的从小到大排序)
for pdf_file in pdf_files:
print(pdf_file)
try:
pdf = pr(open(pdf_file, "rb"))
except:
print(f'{pdf_file}无法解析')
continue
if pdf.isEncrypted:
print(f'{pdf_file} 是加密文件')
res = input('输入密码(回车键跳过)')
while res:
try:
pdf.decrypt(res)# pdf 解密
break
except:
print('密码错误')
res = input('输入密码(回车键跳过)')
if not res:
continue
pageCount = pdf.getNumPages()
# 分别将page添加到输出output中
for iPage in range(pageCount):
merged_file.addPage(pdf.getPage(iPage))
with open('merged.pdf', "wb") as outputfile:
# 注意这里的写法和正常的上下文文件写入是相反的
merged_file.write(outputfile)
print('Done')
input()
if __name__ == '__main__':
# 设置存放多个pdf文件的文件夹
dir_path = r'.'
MergePDF(dir_path) 你好,我正好也写了一个图片合并pdf的工具,有相似的思路,所以发现您代码第12行可能存在不明显的bug。
第12行代码是选择路径+文件名中的第一个数字进行排序,假设有多处数字,第一个数字是相同,后面的数字出现1-10的情况,则他们不能进行排序(大概是1/10/11/2/20/22这样的顺序)
我的思路是将第12行可以这么改动。所有数字合并成一串,再排序。不一定正确,请指正。
pdf_files.sort(key=lambda i: int(''.join(re.findall(r'(\d+).*?', i) ))if re.findall(r'(\d+).*?', i) else -1) v.n.lee 发表于 2020-11-9 20:17
我自己写过类似的,但是合并出来的pdf都是堆叠的,源文件多大合并后就多大,目前合并pdf就Adobe Acrobat合 ...
是这样但是没有办法啊拿钱换存储空间
如果是经常用到那肯定是acrobat好用但是就偶尔用一下就没必要了啊毕竟这个软件也不便宜 只适合64位系统 厉害厉害,小白感谢 感谢 虽然不怎么用PDF 挺实用的,谢谢 感谢分享
感谢!! 很有用 好用好用 收藏了
枫叶荻花 发表于 2020-11-5 18:07
只适合64位系统
32位的可能需要自己打包 谢谢分享。
小白看不大懂。
页:
[1]
2