Eks6666 发表于 2023-7-22 14:45

python提取word文档里的图片

import os.path as osp
from docx import Document, ImagePart
from docx import Document
from PIL import Image

doc = Document("./1-清溪2.docx")
for p in doc.paragraphs:
    images = p._element.xpath('.//pic:pic')# 获取所有图片
    for image in images:
      print(image)
      for img_id in image.xpath('.//a:blip/@r:embed'):# 获取图片id
            part = doc.part.related_parts# 根据图片id获取对应的图片
            if isinstance(part, ImagePart):
                # 保存图片
                with open(osp.basename(part.partname), "wb") as f:                     
                  f.write(part.blob)

orka 发表于 2023-7-22 16:03

可以的,学习了感谢版主

梁茵 发表于 2023-7-22 16:24

感谢楼主分享,我也学习一下提取图片

Diock 发表于 2023-7-22 16:33

博主,是否也能提取pdf照片

Eks6666 发表于 2023-7-22 16:36

Diock 发表于 2023-7-22 16:33
博主,是否也能提取pdf照片

只能提取docx文档里的照片哦{:1_918:}

richhs 发表于 2023-7-22 17:20

谢谢楼主,python 还真挺有用的……想学在python下载homebrew

66fox66 发表于 2023-7-22 17:36

感谢楼主分享。

Marken888 发表于 2023-7-22 18:43

本帖最后由 Marken888 于 2023-7-22 18:44 编辑

挺不错,可以解放双手自动化办公了

daxiongmao666 发表于 2023-7-22 20:22

学习了,谢谢

Diock 发表于 2023-7-23 11:03

Eks6666 发表于 2023-7-22 16:36
只能提取docx文档里的照片哦

了解了,感谢楼主
页: [1] 2
查看完整版本: python提取word文档里的图片