吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2424|回复: 4
收起左侧

[Python 转载] 【python】二合一pdf的裁剪重组

[复制链接]
jjjzw 发表于 2021-4-22 10:46
本帖最后由 jjjzw 于 2021-4-22 12:43 编辑

之前有朋友问我,像这种二合一的PDF有没有恢复为一页一个的办法:

raw

raw

由于确实没百度到,只能想办法用代码来实现切割的功能
python恰好有针对pdf的库:pdf2image和img2pdf
将PDF拆分为图像,遍历切割图像后再重新排序、组合
所需库:PIL、pdf2image、img2pdf

实现代码:
[Python] 纯文本查看 复制代码
from PIL import Image
import os
import img2pdf
from pdf2image import convert_from_path


# https://blog.csdn.net/zhuoqingjoking97298/article/details/110222668 (img2pdf)
# https://blog.csdn.net/zbj18314469395/article/details/98329442 (pdf2image)

def is_number(s):
    try:
        float(s)
        return True
    except ValueError:
        pass
    try:
        import unicodedata
        unicodedata.numeric(s)
        return True
    except (TypeError, ValueError):
        pass
    return False


def pdf_to_img():
    print("输入pdf路径:")
    filepath = input()
    print("正在加载pdf···")
    global name
    global Path
    for i in range(1, 999):
        pathcheck = filepath[-i:-i + 1]
        if pathcheck == "/":
            name = filepath[-i + 1:-4]
            break
    dirs = filepath[:-4] + "/"
    if not os.path.exists(dirs):
        os.makedirs(dirs)
    imgs = convert_from_path(filepath)
    for i, image in enumerate(imgs):
        # 这里规定分离的图片命名位数
        t = str(i).zfill(3)
        image.save(dirs + t + ".png", "PNG")
        print(t + ".png已分离")
        Path = dirs
    print("pdf文件切割完毕\n")


def open_(path):
    im = Image.open(path)
    global height_half
    global height
    global width
    height_half = im.size[1] / 2
    height = im.size[1]
    width = im.size[0]


def cut(filepath, height, i):
    j = str(2 * i + 1)
    l = str(2 * i + 2)
    convertpath = path + "convert/"
    if not os.path.exists(convertpath):
        os.makedirs(convertpath)
    img = Image.open(filepath)
    imup = img.crop((300, 280, width - 1 - 300, height_half - 100))
    # https://blog.csdn.net/weixin_39777626/article/details/82774270
    # 如果输出为png无法写入pdf,因为无法处理alpha通道
    imup.convert("RGB").save(convertpath + j + ".jpg")
    print("已输出" + j + ".jpg")
    imdown = img.crop((300, height_half + 90, width - 1 - 300, height - 289))
    imdown.convert("RGB").save(convertpath + l + ".jpg")
    print("已输出" + l + ".jpg")


def run():
    global path
    if Path[-1:] == "/":
        path = Path
    else:
        path = Path + "/"
    filenames = os.listdir(path)
    for i in range(0, 999):
        n = str(i).zfill(3)
        for file in filenames:
            filenum = str(file)[-7:-4]
            if filenum == n:
                filepath = path + file
                open_(filepath)
                cut(filepath, height, i)
    print("素材分割完毕\n")


def img_to_pdf(path):
    with open(path + "convert/" + name + ".pdf", "wb") as f:
        filelist = os.listdir(path + "convert/")
        pnglist = []
        for m in range(1, 999):
            u = str(m)
            for filename in filelist:
                check00 = filename[-6:-5]
                check000 = filename[-7:-6]
                if not is_number(check00):
                    if u == filename[-5:-4]:
                        pnglist.append(path + "convert/" + filename)
                elif not is_number(check000):
                    if u == filename[-6:-4]:
                        pnglist.append(path + "convert/" + filename)
                else:
                    if u == filename[-7:-4]:
                        pnglist.append(path + "convert/" + filename)
        tran = img2pdf.convert(pnglist)
        f.write(tran)
    print("pdf文件组合完毕")


if __name__ == "__main__":
    global path
    pdf_to_img()
    run()
    img_to_pdf(path)

其中cut()函数可以将图片拆分为上下两部分,并分别作出裁剪(将周围边框修剪掉)
如果裁剪出来是歪的或者没有裁剪干净,则可以修改imup和imdown的参数改变裁剪窗口

运行效果:

cut

cut

完成裁剪!
Tips:理论上四合一以及六合一的pdf都是可以通过这种方法恢复的,只需要调整cut裁剪的规则和文件编号方式,但是分辨率可能会比较低,毕竟多合一是不可逆的破坏了

免费评分

参与人数 1吾爱币 +5 热心值 +1 收起 理由
苏紫方璇 + 5 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

未来的桃子 发表于 2021-4-22 11:19
可以用QI拼版插件
头像被屏蔽
benq7378 发表于 2021-4-22 11:29
zheshiweihe 发表于 2021-4-22 11:35
算法挺好,思想也不错,其实这种python的分享是非常好的,源码开放,不像exe,又编译又破解,麻烦死了,说不定还有病毒
飘云阁 发表于 2021-4-22 11:51
谢谢分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-15 20:47

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表