Eks6666 发表于 2023-9-27 23:01

批量提取PPT文字到word文档

#提取所有文本字符
from pptx import Presentation
data = []
prs = Presentation('data\制造业必修课.pptx')
for slide in prs.slides: #遍历每页PPT
    for shape in slide.shapes: #遍历PPT中的每个形状
      if shape.has_text_frame: #判断该是否包含文本,保证有文本才提取
            for paragraph in shape.text_frame.paragraphs: #按文本框中的段落提取
                data.append(paragraph.text) #提取一个段落的文本,就存到列表data中


#写入文本文件
TxtFile = open('data\制造业必修课.txt', 'w',encoding='utf-8')
for i in data:
    TxtFile.write(i+'\n') #写入并换行,以保证正确分段
TxtFile.close() #保存


#写入word文件
import docx
doc=docx.Document()#创建一个word文件对象
for i in data:
    doc.add_paragraph(i) #增加一个段落,并将列表中的一个字符串写入word文件
doc.save('data\制造业必修课.docx')#保存

zhanglei1371 发表于 2023-9-28 06:26

组合图形,smart art都可以么

hrh123 发表于 2023-9-27 23:39

这代码挺实用的
但是希望能遵守PEP8文档吧{:301_1008:}

chen360781 发表于 2023-9-27 23:48

有用吗,谁试了

liziming 发表于 2023-9-27 23:53

这个技巧好啊

Eks6666 发表于 2023-9-27 23:55

chen360781 发表于 2023-9-27 23:48
有用吗,谁试了

你可以试一下啊,老铁

grrr_zhao 发表于 2023-9-28 00:36

我一看代码就发怵。不会用感觉。。。

sai609 发表于 2023-9-28 07:34

ppt转word,离线软件大把。。。。杀鸡焉用牛刀

yu520 发表于 2023-9-28 08:44

赞,这个好用

bdywbhyw 发表于 2023-9-28 09:08

这个学习下,可能用的到,多谢楼主了!
页: [1] 2
查看完整版本: 批量提取PPT文字到word文档