【分享】搜狗ocr识别
本帖最后由 wushaominkk 于 2018-4-26 14:27 编辑官方链接:http://pic.sogou.com/resource/pic/shitu_intro/index.html?qd=ris_search
```
# _*_ coding: utf-8 _*_
# Time: 2018/3/11/22:50
# Author: dengqing
# Title 搜狗ocr识别接口
# 这个代码涉及到抓包用的fiddler
import requests# 库文件
def post_image():
img = "./ocr.png"# 图片路径
files = {"pic_path": open(img, "rb")}# files # 类似data数据
url = "http://pic.sogou.com/pic/upload_pic.jsp"# post的url
html = requests.post(url, files=files).text# requests 提交图片
get_content(html)# 结果是url就是图片的url sougou 把本地图片上传到sougou服务器变成了他的图片 调用解析函数把url传入
def get_content(keywords):
url = "http://pic.sogou.com/pic/ocr/ocrOnline.jsp?query=" + keywords# keywords就是图片url此方式为get请求
ocrResult = requests.get(url).json()# 直接转换为json格式
contents = ocrResult['result']# 类似字典 把result的value值取出来 是一个list然后里面很多json就是识别的文字
for content in contents:# 遍历所有结果
print(content['content'].strip())# strip去除空格 他返回的结果自带一个换行
post_image()# 调用上传函数
```
成品exe下载链接:链接: https://pan.baidu.com/s/1hmpkwTVcYeDLmZICEC8PKg 密码: c6g6
此exe成品为pyinstaller打包的。 书写情书 发表于 2018-3-13 10:35
识别验证码鸡肋。识别文字好一些
果然如此
http://pic.sogou.com/pic/ocr/ocrOnline.jsp?query=http://img01.sogoucdn.com/app/a/100520146/2A9494E1FD057CBB8B5A70C6AF3F20F2 liphily 发表于 2018-3-13 01:36
接口啊,直接上传到服务器去识别——
能本地算法研究研究就好了
我也想研究研究ocr算法 可能算法在最后get的url里面的js文件里有 调用上床函数。 q30416657 发表于 2018-3-12 23:12
调用上床函数。
尴尬 已修改 没有下载地址? 插眼,感谢楼主分享 liphily 发表于 2018-3-13 01:36
接口啊,直接上传到服务器去识别——
能本地算法研究研究就好了
热血足球。。小时候超爱玩。。:lol make 学习,等下做到自己软件中。谢谢楼主 楼主方便放个成品吗 感谢提供借口 这个还是有些用处,谢谢