DeepSeek识图模式正式上线,多模态能力向用户开放
来源:互联网
时间:2026-07-02 21:32:14
DeepSeek的识图功能已正式登陆其网页端和移动应用程序,标志着这家AI公司在多模态交互领域迈出了关键一步。用户现在可以直接上传图片,让模型进行远超简单文字提取的深度理解与分析。

此次上线的识图模式与现有的“快速模式”和“专家模式”并列,为用户提供了更丰富的交互选择。尽管在部分App端仍显示“图片理解功能内测中”的提示,但网页端已完全开放使用。这一功能的推出,是DeepSeek今年4月公开其多模态模型技术细节后的重要落地应用。
技术框架支撑视觉理解
支撑此次识图功能的核心,是DeepSeek此前公布的名为
“Thinking with Visual Primitives(以视觉原语思考)”
这一技术路径的公开,不仅展示了DeepSeek在多模态AI领域的技术积累,也为用户理解其识图能力的边界和原理提供了窗口。随着功能的正式上线,用户将能更直观地体验和测试这一前沿技术的实际应用效果。