python提取word文档里的图片

Eks6666 · 发表于 2023-7-22 14:45

import os.path as osp
from docx import Document, ImagePart
from docx import Document
from PIL import Image

doc = Document("./1-清溪2.docx")
for p in doc.paragraphs:
images = p._element.xpath('.//pic:pic')  # 获取所有图片
for image in images:
      print(image)
      for img_id in image.xpath('.//a:blip/@r:embed'):  # 获取图片id
         part = doc.part.related_parts[img_id]  # 根据图片id获取对应的图片
         if isinstance(part, ImagePart):
            # 保存图片
            with open(osp.basename(part.partname), "wb") as f:
                  f.write(part.blob)

orka · 发表于 2023-7-22 16:03

可以的，学习了感谢版主

梁茵 · 发表于 2023-7-22 16:24

感谢楼主分享，我也学习一下提取图片

Diock · 发表于 2023-7-22 16:33

博主，是否也能提取pdf照片

Eks6666 · 发表于 2023-7-22 16:36

Diock 发表于 2023-7-22 16:33
博主，是否也能提取pdf照片

只能提取docx文档里的照片哦

richhs · 发表于 2023-7-22 17:20

谢谢楼主，python 还真挺有用的……想学在python下载homebrew

66fox66 · 发表于 2023-7-22 17:36

感谢楼主分享。

Marken888 · 发表于 2023-7-22 18:43

本帖最后由 Marken888 于 2023-7-22 18:44 编辑

挺不错，可以解放双手自动化办公了

daxiongmao666 · 发表于 2023-7-22 20:22

学习了，谢谢

Diock · 发表于 2023-7-23 11:03

Eks6666 发表于 2023-7-22 16:36
只能提取docx文档里的照片哦

了解了，感谢楼主

帐号		自动登录	找回密码
密码			注册[Register]

[学习记录] python提取word文档里的图片