吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 794|回复: 15
收起左侧

[学习记录] python提取word文档里的图片

  [复制链接]
Eks6666 发表于 2023-7-22 14:45
import os.path as osp
from docx import Document, ImagePart
from docx import Document
from PIL import Image

doc = Document("./1-清溪2.docx")
for p in doc.paragraphs:
    images = p._element.xpath('.//pic:pic')  # 获取所有图片
    for image in images:
        print(image)
        for img_id in image.xpath('.//a:blip/@r:embed'):  # 获取图片id
            part = doc.part.related_parts[img_id]  # 根据图片id获取对应的图片
            if isinstance(part, ImagePart):
                # 保存图片
                with open(osp.basename(part.partname), "wb") as f:                     
                    f.write(part.blob)

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

orka 发表于 2023-7-22 16:03
可以的,学习了感谢版主
梁茵 发表于 2023-7-22 16:24
Diock 发表于 2023-7-22 16:33
 楼主| Eks6666 发表于 2023-7-22 16:36
Diock 发表于 2023-7-22 16:33
博主,是否也能提取pdf照片

只能提取docx文档里的照片哦
richhs 发表于 2023-7-22 17:20
谢谢楼主,python 还真挺有用的……想学在python下载homebrew
66fox66 发表于 2023-7-22 17:36
感谢楼主分享。
Marken888 发表于 2023-7-22 18:43
本帖最后由 Marken888 于 2023-7-22 18:44 编辑

挺不错,可以解放双手自动化办公了
daxiongmao666 发表于 2023-7-22 20:22
学习了,谢谢
Diock 发表于 2023-7-23 11:03
Eks6666 发表于 2023-7-22 16:36
只能提取docx文档里的照片哦

了解了,感谢楼主
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 21:57

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表