本帖最后由 WyattHuang 于 2018-9-20 13:13 编辑
Python版AI文字识别主要代码:(代码及表格选自百度AI官网:http://ai.baidu.com/docs#/OCR-Python-SDK/top)
说明:
如果帖子有违规,请管理员删除
1. 首先,先在百度AI的官网申请一个 “语言识别API” 的使用权(免费):
申请地址:https://console.bce.baidu.com/ai/#/ai/speech/overview/index
2. 然后把申请后百度发给你的App_ID, API_Key 和 SECRET_Key 写入程序:
[Python] 纯文本查看 复制代码 from aip import AipOcr
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
3. 主程序:
[Python] 纯文本查看 复制代码
""" 读取图片 """
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
"""如果识别的图片是本地的图片 """
image = get_file_content('example.jpg')
""" 调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image);
""" 如果有可选参数(参数详情见下面的表格) """
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"
""" 带参数调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image, options)
"""如果识别的图片是网上的图片 """
url = "https//www.x.com/sample.jpg"
""" 调用通用文字识别, 图片参数为远程url图片 """
client.basicGeneralUrl(url);
""" 如果有可选参数(参数详情见下面的表格) """
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"
""" 带参数调用通用文字识别, 图片参数为远程url图片 """
client.basicGeneralUrl(url, options)
参数说明表:
4. 然后运行程序,如果不出意外的话,就会得到一系列返回值:
[Python] 纯文本查看 复制代码 {
"log_id": 2471272194,
"words_result_num": 2,
"words_result":
[
{"words": " TSINGTAO"},
{"words": "青島睥酒"}
]
}
比如说以上的返回值,图像识别结果就是;
TSNGTAO
青島睥酒
|