吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1226|回复: 9
收起左侧

[求助] python 从图片中识别文字的问题

[复制链接]
cqwcns 发表于 2022-8-2 12:57
我希望获取某猫超市的一些产品信息,通过urllib.request,我们很容易获得html。
但经过一番检查,html中并没有优惠后的价格。优惠后的价格只显示在图片。


看来只能通过识别图片文字来获得。


关于python从图片从识别文字这种需求,各位大佬有什么第三方库推荐?感谢。


微信图片_20220802125134.png

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

wty3025 发表于 2022-8-2 13:02
tesseract

免费评分

参与人数 1吾爱币 +1 收起 理由
cqwcns + 1 谢谢@Thanks!

查看全部评分

BurYiA 发表于 2022-8-2 13:05
纯数字应该还相对好做一些,可以去github上看看开源的图文识别框架
hackerbob 发表于 2022-8-2 13:06
chinapython 发表于 2022-8-2 13:18
1、随便找个ocr模型都可以跑的,因为只是简单的数字,这里建议在github上找点 运行速度快的模型
2、我也看了一下 天猫超市的 这个图片上有价格的情况,不建议直接提取图片上的价格,因为很多图片上没有价格
thesunone 发表于 2022-8-2 13:39
求助帖里也能学习!
Prozacs 发表于 2022-8-2 14:28
优惠价格在图片位置是固定的。直接截取价格那一小部分图片就比较好识别了。

免费评分

参与人数 1吾爱币 +1 收起 理由
cqwcns + 1 谢谢@Thanks!

查看全部评分

52pojiema 发表于 2022-8-2 14:57
我记得价格在一个文件里
yxnwh 发表于 2022-8-2 15:26
百度ocr,直接文字识别出来,只不过识别出来的优惠价格没有什么规律,你要找到批量提取出来的办法

免费评分

参与人数 1热心值 +1 收起 理由
cqwcns + 1 热心回复!

查看全部评分

 楼主| cqwcns 发表于 2022-8-2 16:55
这样可以
[Python] 纯文本查看 复制代码
import pytesseract
from PIL import Image

print('开始')
img = Image.open("D:\\Files\\python\\img_to_str\\test2.jpg")
# img = Image.open('//img.alicdn.com/bao/uploaded/i2/6000000008042/O1CN01DUtFLo29HHvwMKXCo_!!6000000008042-0-picassoopen.jpg')

# 剪裁出右下角
region = img.crop((585, 700, 800, 800))

str = pytesseract.image_to_string(region, lang="chi_sim")

print(str)
print('完成')
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-29 00:02

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表