首页 > 教程攻略 > 热点新闻 >DeepSeek识图模式正式上线，多模态能力向用户开放

DeepSeek识图模式正式上线，多模态能力向用户开放

来源：互联网时间：2026-07-02 21:32:14

DeepSeek的识图功能已正式登陆其网页端和移动应用程序，标志着这家AI公司在多模态交互领域迈出了关键一步。用户现在可以直接上传图片，让模型进行远超简单文字提取的深度理解与分析。

此次上线的识图模式与现有的“快速模式”和“专家模式”并列，为用户提供了更丰富的交互选择。尽管在部分App端仍显示“图片理解功能内测中”的提示，但网页端已完全开放使用。这一功能的推出，是DeepSeek今年4月公开其多模态模型技术细节后的重要落地应用。

支撑此次识图功能的核心，是DeepSeek此前公布的名为

“Thinking with Visual Primitives（以视觉原语思考）”

的技术框架。该框架旨在让模型能够像人类一样，通过分解和理解视觉元素的基本构成来进行思考与推理。

这一技术路径的公开，不仅展示了DeepSeek在多模态AI领域的技术积累，也为用户理解其识图能力的边界和原理提供了窗口。随着功能的正式上线，用户将能更直观地体验和测试这一前沿技术的实际应用效果。