书写情书 发表于 2018-3-12 22:54

【分享】搜狗ocr识别

本帖最后由 wushaominkk 于 2018-4-26 14:27 编辑

官方链接:http://pic.sogou.com/resource/pic/shitu_intro/index.html?qd=ris_search
```
# _*_ coding: utf-8 _*_
# Time: 2018/3/11/22:50
# Author: dengqing
# Title 搜狗ocr识别接口
# 这个代码涉及到抓包用的fiddler

import requests# 库文件


def post_image():
    img = "./ocr.png"# 图片路径
    files = {"pic_path": open(img, "rb")}# files # 类似data数据
    url = "http://pic.sogou.com/pic/upload_pic.jsp"# post的url
    html = requests.post(url, files=files).text# requests 提交图片
    get_content(html)# 结果是url就是图片的url sougou 把本地图片上传到sougou服务器变成了他的图片 调用解析函数把url传入


def get_content(keywords):
    url = "http://pic.sogou.com/pic/ocr/ocrOnline.jsp?query=" + keywords# keywords就是图片url此方式为get请求
    ocrResult = requests.get(url).json()# 直接转换为json格式
    contents = ocrResult['result']# 类似字典 把result的value值取出来 是一个list然后里面很多json就是识别的文字
    for content in contents:# 遍历所有结果
      print(content['content'].strip())# strip去除空格 他返回的结果自带一个换行


post_image()# 调用上传函数
```

成品exe下载链接:链接: https://pan.baidu.com/s/1hmpkwTVcYeDLmZICEC8PKg 密码: c6g6
此exe成品为pyinstaller打包的。

LeoSky 发表于 2018-3-13 10:44

书写情书 发表于 2018-3-13 10:35
识别验证码鸡肋。识别文字好一些

果然如此
http://pic.sogou.com/pic/ocr/ocrOnline.jsp?query=http://img01.sogoucdn.com/app/a/100520146/2A9494E1FD057CBB8B5A70C6AF3F20F2

书写情书 发表于 2018-3-13 10:12

liphily 发表于 2018-3-13 01:36
接口啊,直接上传到服务器去识别——
能本地算法研究研究就好了

我也想研究研究ocr算法 可能算法在最后get的url里面的js文件里有

q30416657 发表于 2018-3-12 23:12

调用上床函数。

书写情书 发表于 2018-3-12 23:14

q30416657 发表于 2018-3-12 23:12
调用上床函数。

尴尬 已修改

liuxinming67 发表于 2018-3-12 23:42

没有下载地址?

都同学 发表于 2018-3-13 00:05

插眼,感谢楼主分享

小kgg 发表于 2018-3-13 08:27

liphily 发表于 2018-3-13 01:36
接口啊,直接上传到服务器去识别——
能本地算法研究研究就好了

热血足球。。小时候超爱玩。。:lol

rgdyyxf 发表于 2018-3-13 08:58

make 学习,等下做到自己软件中。谢谢楼主

peterq521 发表于 2018-3-13 09:15

楼主方便放个成品吗

w4526423 发表于 2018-3-13 09:39

感谢提供借口

howardlee 发表于 2018-3-13 09:49

这个还是有些用处,谢谢
页: [1] 2 3 4
查看完整版本: 【分享】搜狗ocr识别