吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2058|回复: 50
收起左侧

[Python 原创] 免翻免费:python调用Mistral的API实现PDF文件和图片OCR识别

  [复制链接]
lianxiang1122 发表于 2025-3-11 18:12
如果你不想花钱就调用AI的API接口,可以用谷歌,但是需要翻。。。最近发现Mistral也可以,来自欧洲的AI,免翻还不用充值。。。支持OCR调用。

先登录官网:https://mistral.ai,点击右上方的“try the API",弹出登录页面,直接用微软账号登录,话说该拥有个微软账号了,某度广告泛滥,bing是个不错的选择。

image.png


使用微软账号登录。
image.png

登陆后,就进入API申请页面了,点击左侧的API key,
image.png
创建一个key,并复制下来,因为关闭页面后就不可再看该KEY了,如果以后忘了,可以删除后,再创建,提示可以创建10个。
image.png

好了,有了Key了,就可以愉快的玩耍了。。。。
怎么用呢?看官方教程,点击docs,再点击左侧的OCR。。。
当然了,用python第一步是要装库的,pip install mistralai,硬装就行了

image.png


例如,我们转换一个扫描版的PDF文件为MD格式,找到文档的OCR with uploaded PDF,将下面的代码复制到IDE中,修改下KEY和文件名就行了。

image.png

参考代码如下:

[Python] 纯文本查看 复制代码
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
import os
from mistralai import Mistral
 
api_key = "你的API Key"
 
client = Mistral(api_key=api_key)
 
uploaded_pdf = client.files.upload(
    file={
        "file_name": "2.pdf",
        "content": open("2.pdf", "rb"),
    },
    purpose="ocr"
 
client.files.retrieve(file_id=uploaded_pdf.id)
 
signed_url = client.files.get_signed_url(file_id=uploaded_pdf.id)
 
ocr_response = client.ocr.process(
    model="mistral-ocr-latest",
    document={
        "type": "document_url",
        "document_url": signed_url.url,
    }
)
 
print(ocr_response)


结果如下:
image.png

如何转成MD格式呢?我们观察一下这个结果ocr_response里面的pages是一个列表,可以自己把ocr_response.pages打印出来看一下,其实列表里面的项就是mistral识别到的PDF文件的每一页,一页一个列表的项。
image.png

先测试一下第一项ocr_response.pages[0],虽然有点复杂,但是里面有一个markdown,我们可以打印出来看一下

image.png


打印markdown,里面就是MD格式的内容,接下来就方便了,直接另存为MD格式就行了。

print(ocr_response.pages[0].markdown)

image.png

另存为MD格式参考代码:
[Python] 纯文本查看 复制代码
1
2
3
4
5
# 将字符串保存为 Markdown 文件
with open("example.md", "w", encoding="utf-8") as file:
    file.write(content)
 
print("Markdown 文件已保存为 'example.md'")


如果多页的话,我们用for循环一下ocr_response.pages,再拼接一下另存为MD就行了。

PDF搞定了,图片就简单了,按照教程做就行了,不在重复了。另外,他还能理解文档,这个没测试,小伙伴们自己玩一下吧。

好了,就分享到这里了。有疑问随时沟通。



免费评分

参与人数 9吾爱币 +9 热心值 +9 收起 理由
stone12315 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
苏紫方璇 + 3 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
xinxin99 + 1 + 1 谢谢@Thanks!
7086pp + 1 + 1 用心讨论,共获提升!
蔷薇的羽翼 + 1 + 1 我很赞同!
Functionzy + 1 我很赞同!
889_ + 1 + 1 我很赞同!
shanzhanzhe + 1 + 1 谢谢@Thanks!
nt0114 + 1 热心回复!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| lianxiang1122 发表于 2025-3-12 17:09
pyjiujiu 发表于 2025-3-12 15:07
谢谢分享,看新闻说是中文支持不太好,不过看楼主的好像还不错

嗯嗯,AI也在进化这些天用下来感觉很好用。。。。
 楼主| lianxiang1122 发表于 2025-3-12 17:08
laozhang4201 发表于 2025-3-12 14:56
哦。我也只是遇到过一次,也许我当时碰巧遇上的吧。看来是想多了。

哈哈哈,我感觉只要别用来做违法的事,都懒得搭理你。。。。
wudavid33 发表于 2025-3-11 21:13
Yukeer666 发表于 2025-3-11 21:18
感谢分享啊
hun8461 发表于 2025-3-11 21:49
可以识别中文吗?
 楼主| lianxiang1122 发表于 2025-3-11 22:42
hun8461 发表于 2025-3-11 21:49
可以识别中文吗?

可以,不区分语言种类,自动识别。。。但是对文件有没有大小限制就不知道了。。。。。
4a3e57cb-52f5-459d-8dee-bfb93b22585a.png
sdieedu 发表于 2025-3-12 06:21
看起来不错
sdieedu 发表于 2025-3-12 07:06
看起来很强大
masteryun 发表于 2025-3-12 08:09
能保留排版格式吗?还是只是提取文本?
user_0628 发表于 2025-3-12 08:33
看起来很强大
zhaohainuo 发表于 2025-3-12 09:10
感谢分享,速度去尝试
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-4-4 07:29

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表