python提取word文档里的图片
import os.path as ospfrom docx import Document, ImagePart
from docx import Document
from PIL import Image
doc = Document("./1-清溪2.docx")
for p in doc.paragraphs:
images = p._element.xpath('.//pic:pic')# 获取所有图片
for image in images:
print(image)
for img_id in image.xpath('.//a:blip/@r:embed'):# 获取图片id
part = doc.part.related_parts# 根据图片id获取对应的图片
if isinstance(part, ImagePart):
# 保存图片
with open(osp.basename(part.partname), "wb") as f:
f.write(part.blob)
可以的,学习了感谢版主 感谢楼主分享,我也学习一下提取图片 博主,是否也能提取pdf照片 Diock 发表于 2023-7-22 16:33
博主,是否也能提取pdf照片
只能提取docx文档里的照片哦{:1_918:} 谢谢楼主,python 还真挺有用的……想学在python下载homebrew 感谢楼主分享。 本帖最后由 Marken888 于 2023-7-22 18:44 编辑
挺不错,可以解放双手自动化办公了 学习了,谢谢 Eks6666 发表于 2023-7-22 16:36
只能提取docx文档里的照片哦
了解了,感谢楼主
页:
[1]
2