首页 > 教程攻略 > ai资讯 >Mistral AI发布OCR4 模型:支持 170 种语言,输出质量超越GPT与Gemini

Mistral AI发布OCR4 模型:支持 170 种语言,输出质量超越GPT与Gemini

来源:互联网 时间:2026-06-27 14:42:06

法国AI初创公司Mistral AI在2月23日正式发布了其最新文档内容识别模型OCR 4,这枚重磅冲击波直接投向光学字符识别领域。别看它是个小型聚焦模型,能力却相当全面——支持横跨10个语族、多达170种语言。在权威基准测试OmniDocBench中,它拿下了93.07分的高分,关键是在输出质量上,人类评审更倾向于它,而不是GPT 5.5 Pro或Gemini 3.1 Pro Preview这些对手。

image.png

小型但全面,覆盖多场景下游任务

OCR 4的定位很明确:不靠参数规模取胜,而是专精于文档识别的高效模型。它在输出识别文本的同时,还能提供边框定位、区域分类以及置信度评分。这意味着它可以广泛支持RAG语义分块、智能体结构化基本单元、连接器结构化内容等多种下游工作负载——实用性很强。

定价方面,OCR 4的API调用基础价格是每千页4美元,如果采用批处理方式,还能享受50%的折扣。文档AI定价则是每千页5美元。这个价位对于企业级应用来说,性价比相当突出。

作为欧洲AI领域最具代表性的初创公司之一,Mistral AI此前凭借开源与闭源并行的模型策略,已经在全球市场打响了名号。这次推出OCR 4,相当于把能力从通用大语言模型延伸到了文档智能处理这一垂直赛道,直接与OpenAI、Google等巨头在基础工具层展开竞争。从行业趋势来看,文档识别这一细分领域正在成为新的战场,Mistral这一步走得相当精准。