吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1462|回复: 18
收起左侧

[学习记录] 多个word文档中关键字检索

  [复制链接]
fengxiaoxiao7 发表于 2022-11-14 14:34
import os
from docx import Document

def search_word_in_docx(path, keyword):
    # 获取当前路径下所有文件列表
    files = os.listdir(path)
    # 筛选出.docx格式的word文档
    for file in files:
        n = 0
        # 若是存在doc格式的word文档,则将其批量转换为.docx格式即可
        if file.endswith('.docx') and not file.startswith('-$') and not file.startswith("~$"):
            # 打开woord文档
            doc = Document(path + file)
            # 获取word文档每一行的内容
            for i in doc.paragraphs:
                if n > 0:
                    print(i.text)
                    n = n - 1
                if keyword in i.text:
                    print("-----------------------------\n\n")
                    print("file:" + file + "\n")
                    print(i.text)
                    n = 10 # 往后输出10行

path="" #文件目录
keyword = ""
search_word_in_docx(path,keyword)

免费评分

参与人数 3吾爱币 +3 热心值 +1 收起 理由
JadenZh + 1 用心讨论,共获提升!
yunchu + 1 + 1 热心回复!
Wai22HMOV + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

zhihuanwang 发表于 2022-11-14 16:06
学习了                                 看看
aa123dami 发表于 2022-11-14 16:41
xiaolinjing 发表于 2022-11-14 16:58
juewangchenxi 发表于 2022-11-14 18:02
学习了,谢谢大佬
yunchu 发表于 2022-11-14 18:58
学习一下
lxl8448 发表于 2022-11-14 20:55
感谢分享,值得学习
lbg2222000 发表于 2022-11-14 21:23
值得学习,谢谢分享
zhongwenmingma 发表于 2022-11-15 09:26
感谢分享,辛苦了
w4343c 发表于 2022-11-15 10:10
感谢十分有用~
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-12 01:49

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表