首页 > 教程攻略 > ai资讯 >DeepSeek大范围开放识图模式:多模态理解功能正式开启内测

DeepSeek大范围开放识图模式:多模态理解功能正式开启内测

来源:互联网 时间:2026-06-12 14:59:06

DeepSeek大规模识图模式的内测大门正式敞开,这意味着国产大模型阵营中的这位尖兵,已经全面踏入了图文多模态交互的新战场。继四月底的小范围试探性测试后,5月9日,DeepSeek大幅放宽了“识图模式”的访问权限。目前,多数测试账号都能在对话界面看到一个新增的独立入口。虽然系统仍挂着“功能内测中”的标签,但这个入口被置于输入框上方,与“快速模式”、“专家模式”并列排布——这种布局本身就在传递一个清晰的信号:多模态理解能力,已经成为其核心产品矩阵中不可或缺的一环。

QQ20260509-142648.jpg

这次升级的核心,远不止于传统的OCR文字提取。它的关键在于深度的图片识别与语义理解能力。从实际测试来看,该模式能够对视觉信息进行逻辑拆解和情境感知,用户可以直接上传图片,实现更为复杂的跨媒介交互。这一步,恰好填补了DeepSeek此前在多模态理解领域的空白,也标志着它在追赶GPT-4o等国际顶尖模型的赛道上,迈出了实质性的一步。

从行业发展的角度看,DeepSeek在维持极高算力性价比优势的同时,迅速补上多模态这块短板,反映出一个明确的趋势:国产大模型的竞争焦点,正从单一的文本生成能力,转向全感官的“视觉-语言”耦合能力。随着识图功能的全面铺开,可以预见,DeepSeek将在自动化办公、工业视觉理解、复杂图表分析等垂直领域,激发出更大的生产力。这种从“读字”到“识物”的跨越,不仅拓展了产品本身的交互边界,也势必将推动国内大模型市场加速进入一个多模态能力普惠的新阶段。