吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2213|回复: 4
收起左侧

[求助] python 读取word文件中书签并将word文件转成pdf

[复制链接]
hymyudan 发表于 2020-12-4 15:01
想用python把word中得书签读取上来,然后用测试的结果代替掉,结果现在连word都没读上来。求大牛指点。还有后续的将word打印成pdf的部分有方法的也可以告知一下,谢谢
word文件好像无法上传?这咋搞


现在是用win32com然后就报出
Traceback (most recent call last):
  File "D:\python\Main.py", line 2, in <module>
    app = client.Dispatch(r'D:\python\test.docx')  # 启动独立进程
  File "E:\python\lib\site-packages\win32com\client\__init__.py", line 95, in Dispatch
    dispatch, userName = dynamic._GetGoodDispatchAndUserName(dispatch,userName,clsctx)
  File "E:\python\lib\site-packages\win32com\client\dynamic.py", line 98, in _GetGoodDispatchAndUserName
    return (_GetGoodDispatch(IDispatch, clsctx), userName)
  File "E:\python\lib\site-packages\win32com\client\dynamic.py", line 83, in _GetGoodDispatch
    IDispatch = pythoncom.CoCreateInstance(IDispatch, None, clsctx, pythoncom.IID_IDispatch)
pywintypes.com_error: (-2147221005, '无效的类字符串', None, None)

from win32com import client
app = client.Dispatch(r'D:\python\test.docx')  # 启动独立进程
app.Visible = True #// 设置是否可见, 如果为false, 则后台运行
word = app.Documents.Open('Word文档路径')  # 打开word文档
bookmarks = word.BookMarks  # 获取所有书签
用docx就报出在 'docx.py' 中找不到引用 'document'

from docx import document

#读取全文本

document = Document(r'D:\python\test.docx')
all_paragraphs = document.paragraphs
for paragraph in all_paragraphs:
    print(paragraph.text)

#   读取表格中的文字
document = Document(r'D:\python\test.docx')
all_tables = document.tables
for table in all_tables:
    for row in table.rows:
        for cell in row.cells:
            print(cell.text)

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

yeqin 发表于 2020-12-5 17:38
我是小白,为了处理PDF文档,曾经搜索过本论坛,有一文似乎对您有帮助,标题是:[Python] python操作excel、word、pdf
 楼主| hymyudan 发表于 2020-12-7 10:13
yeqin 发表于 2020-12-5 17:38
我是小白,为了处理PDF文档,曾经搜索过本论坛,有一文似乎对您有帮助,标题是: python操作excel、word、pd ...

对,我也搜了很久,看到里面操作word的方法了,按那个方法操作就是会提示下面那个找不到引用
heiyijiushi 发表于 2021-2-28 17:38
word = app.Documents.Open('Word文档路径')  # 打开word文档
myRange = word.Content #代表主文档文章
bookmarks = myRange .BookMarks  # 获取所有书签

中间加一行
祝福看到你 发表于 2021-3-1 17:37
Word 导出pdf
app = win32com.client.Dispatch('Word.Application')
word = app.Documents.Open(wordpath)
word.ExportAsFixedFormat(outpath, 17)
word.Close
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-16 22:04

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表