吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1959|回复: 8
收起左侧

[Python 原创] 利用paddle实现图片文本智能提取

[复制链接]
lianxiang1122 发表于 2024-2-22 16:55
paddle又名飞桨,是百度开发的免费开源深度学习平台,诞生出来很多优秀产品,如文心大模型。也应用于了很多产业中,详见官方主页飞桨PaddlePaddle-源于产业实践的开源深度学习平台(https://www.paddlepaddle.org.cn)。
今天分享一个开箱即用的产业级的智能自然语言的NLP预置模型,可以识别图片的中文字,并且还会分词、词法分析、句法分析、信息抽取、知识挖掘、文本纠错、文本匹配、文本摘要、闲聊、知识问答、文生图等十余项经典任务,提供产业级的效果与极致的推理性能。
首先,需要安装paddle,进入官网(https://www.paddlepaddle.org.cn),按照提示安装就行了,不再啰嗦。有GPU的可以安装GPU版本,处理速度比CPU快多了。

安装

安装

飞桨中的模型库都依赖与paddle,安装完之后,输入import paddle ,再输入 paddle.utils.run_check(),测试一下安装是否成功。

测试paddle

测试paddle

因为我安装的是GPU版本,所以提示PaddlePaddle works well on 1 GPU。安装GPU版本比较麻烦,需要安装CUDAcuDNN,新手很容易迷路,你可以安装CPU版本,直接pip安装完就能用。
paddle有很多模型,今天我们使用NLP模型,找到“产品全景”中的paddleNLP,https://www.paddlepaddle.org.cn/paddle/paddlenlp

NLP

NLP


NLP又有很多模型,我们使用ERNIE-Layout这个模型。点击进入github详细介绍页(github有时打不开,找不同的时间点多试试)。

layout

layout


详细介绍看完了,如何使用呢?既然是开箱即用,那么我们就可以直接使用。首先,需要安装paddleNLP,跟Python其他库的安装方法一样,用pip安装。
pip install --pre --upgrade paddlenlp -f https://www.paddlepaddle.org.cn/whl/paddlenlp.html
安装完之后,输入以下命令,引出paddlenlp,并下载一些基础数据啥的。

from paddlenlp import Taskflow
docprompt = Taskflow("document_intelligence")
我们再准备一张图片,例如一张简历。我们提取图片中应聘者一些信息。

简历

简历


我们想要在图片中找到以下3各问题,"五百丁本次想要担任的是什么职位?", "五百丁是在哪里上的大学?", "大学学的是什么专业?"。
我们直接把图片地址,以及我们问题抛给docprompt 。
print(docprompt([{"doc": "resume.png", "prompt": ["五百丁本次想要担任的是什么职位?", "五百丁是在哪里上的大学?", "大学学的是什么专业?"]}]))

result

result


我们还可以再在prompt中追加问题,如"多大年龄?", "什么学历?"

print(docprompt([{"doc": "resume.png", "prompt": ["五百丁本次想要担任的是什么职位?", "五百丁是在哪里上的大学?",  "大学学的是什么专业?", "多大年龄?", "什么学历?"]}]))

zuijia

zuijia


完整代码如下:
from paddlenlp import Taskflow
docprompt = Taskflow("document_intelligence")
pic_adress = "resume.png"
question = ["五百丁本次想要担任的是什么职位?", "五百丁是在哪里上的大学?", "大学学的是什么专业?", "多大年龄?", "什么学历?"]
result = docprompt([{"doc": pic_adress,  "prompt": question}])
print(result)

如果你有很多张图片需要提取,那么就用上for循环,再配合上处理电子表格的库,就可以批量的把扫描图片中的信息自动提取出来了。

paddlenlp不拘泥于固定格式,例如收到的简历可能五花八门各式各样的,paddlenlp可以理解自然语言,智能的轻松的提取出图片中的内容。

引用

引用

免费评分

参与人数 4吾爱币 +10 热心值 +4 收起 理由
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
blindcat + 1 + 1 谢谢@Thanks!
Bob5230 + 1 + 1 我很赞同!
愷龍 + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

sai609 发表于 2024-2-22 17:53
OCR识别早就可以了
blindcat 发表于 2024-2-23 07:48
wapjsx 发表于 2024-2-23 08:17
sai609 发表于 2024-2-22 17:53
OCR识别早就可以了

OCR识别后呢??? 关键还是自然语言并返回结果!
IT大小白 发表于 2024-2-28 19:05
运行报错:
docprompt = Taskflow("document_intelligence")
RuntimeError: (NotFound) Operator (one_hot) is not registered.
  [Hint: op_info_ptr should not be null.] (at ..\paddle/fluid/framework/op_info.h:152)
 楼主| lianxiang1122 发表于 2024-2-29 09:51
IT大小白 发表于 2024-2-28 19:05
运行报错:
docprompt = Taskflow("document_intelligence")
RuntimeError: (NotFound) Operator (one_h ...

我也不知道是啥问题,有可能是你的paddle不是最新版吧。建议你去官网下载最新版paddlepaddle试一试。https://www.paddlepaddle.org.cn/
greatzdl 发表于 2024-2-29 11:21
感觉比较实用了,是不是可以把网页截图 然后处理图片识别一些信息。这种新爬方法是不是很给力
crary06 发表于 2024-2-29 15:07
挺好的,很方便,就是不知道速度怎么样。。。。
latucc 发表于 2024-3-14 17:58
感觉可以ocr之后,把文本和问题直接发给gpt的api,一样拿到答案还说不定更准
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 18:29

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表