吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1428|回复: 12
收起左侧

[Python 原创] 把word文档拆分成多个文档

[复制链接]
zjg121 发表于 2024-4-4 06:52
word文档中有多个部分,每一部分的开始标志是:段首为数字+冒号(形如1:,9:,13:,……)。
[Python] 纯文本查看 复制代码
from docx import Document

for i in range(1,14):
    # 输入Word文档路径
    input_docx = f'D:/52pj/fengzhang/老杨.458条人性秘术{str(i).zfill(2)}.docx'
    for j in range(1,100):
        # 输出Word文档路径
        output_docx = f'D:/52pj/fengzhang/fengzhangjie/老杨.458条人性秘术{str(i).zfill(2)}{str(j).zfill(2)}.docx'
        len1 = len(str(j))+1
        len2 = len(str(j+1))+1

        # 加载Word文档
        doc = Document(input_docx)

        # 标记是否已找到“第二章”或“第三章”
        found_chapter_two = False
        found_chapter_three = False

        # 用于存储要保留的段落
        paragraphs_to_keep = []

        # 遍历文档中的段落
        for paragraph in doc.paragraphs:
            # 检查段首三个字符是否是“第二章”或“第三章”
            if paragraph.text[:len1] == f'{str(j)}:':
                found_chapter_two = True
                paragraphs_to_keep.append(paragraph)
            elif paragraph.text[:len2] == f'{str(j+1)}:':
                found_chapter_three = True
                break  # 找到“第三章”后停止遍历
            elif found_chapter_two:
                # 如果已经找到了“第二章”,则保留当前段落及以后的段落
                paragraphs_to_keep.append(paragraph)

            # 如果找到“第三章”,则只保留到“第二章”的内容
        # if found_chapter_three:
            # paragraphs_to_keep = paragraphs_to_keep[:1]  # 只保留第一个段落(通常是“第二章”本身)

        # 创建一个新的Word文档,并添加要保留的段落
        new_doc = Document()
        if paragraphs_to_keep:
            for paragraph in paragraphs_to_keep:
                new_doc.add_paragraph(paragraph.text, style=paragraph.style)

            # 保存新的Word文档
            new_doc.save(output_docx)

            print(f"处理完成,修改后的内容已保存到 {output_docx}")

免费评分

参与人数 4吾爱币 +10 热心值 +4 收起 理由
shuisanyue + 1 + 1 谢谢@Thanks!
0120 + 1 + 1 热心回复!
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
hshcompass + 1 + 1 用心讨论,共获提升!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

sgw1970 发表于 2024-4-4 07:56
不知道源文档拆分后还在吗?
 楼主| zjg121 发表于 2024-4-4 07:59
sgw1970 发表于 2024-4-4 07:56
不知道源文档拆分后还在吗?

源文件还在。拆分生成的大量新文件放在一个文件夹里了。
毋庸讳言 发表于 2024-4-4 08:09
 楼主| zjg121 发表于 2024-4-4 08:26
毋庸讳言 发表于 2024-4-4 08:09
是否可以自己的要求拆分呢?

可以。修改一下每一部分的开始标志就行了。
宜城小站 发表于 2024-4-4 10:14
感谢分享
个人感觉
这样的操作实用性很大
Shebinyang 发表于 2024-4-4 11:46
学习了,先保存,以后用一下试试
lelewuqiong 发表于 2024-4-4 20:52
学习学习
hshcompass 发表于 2024-4-4 22:23
谢谢分享
aluda666 发表于 2024-4-4 23:03
顶贴支撑一下楼主
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 15:44

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表