首页 > 教程攻略 > 热点新闻 >DeepSeek识图功能正式上线:基础识别表现稳定,人物识别存特殊限制

DeepSeek识图功能正式上线:基础识别表现稳定,人物识别存特殊限制

来源:互联网 时间:2026-07-01 22:53:17

近日,DeepSeek多模态模型的图像识别功能已在网页端和移动应用端全面开放使用。这项功能自今年4月底开启小范围测试后,如今正式面向所有用户推出,标志着该品牌首次原生集成了图像理解能力。对于需要处理图像信息的用户而言,这一更新提供了更为便捷的交互方式。

DeepSeek识图功能正式上线:基础识别表现稳定,人物识别存特殊限制

从实际测试结果来看,DeepSeek的识图模型在多个常见场景下表现出了可靠的能力。

模型在识别日常物体、著名地标建筑以及数学题目截图等方面效果稳定,响应速度也令人满意。

特别是在处理数学问题时,系统不仅能够识别题目内容,还能自动进行验算步骤,显示出其在基础图像理解任务上的扎实功底。

人物识别场景出现特殊状况

然而,在涉及人物识别的特定场景中,该功能暴露出了两处较为特殊的局限性。首先,模型多次测试均无法准确识别其创始人梁文锋,经常将其错误识别为其他商业人士。行业分析认为,这很可能是因为梁文锋本人行事较为低调,在公开网络上留存的高质量照片数量有限,导致模型训练过程中缺乏足够样本以形成稳定的识别特征。

更为有趣的是,当用户尝试上传小米公司创始人雷军的照片时,系统会直接拦截该请求,

照片根本无法发送给模型进行处理

。这一行为的具体技术原因尚未得到官方详细说明,但无疑为用户体验增添了一层独特的观察视角。

未来发展与资本动态

根据官方公布的路线图,DeepSeek计划在本月内推出全新的V4.1版本。该版本将实现对文本、图像、音频全模态能力的完整覆盖,并同步推出面向企业用户的专业工具链,旨在拓展其在商业环境中的应用范围。

在资本层面,DeepSeek近期完成了其首轮大规模融资。

融资额约为510亿元软妹币,公司估值已接近4000亿元大关。

此次引入的多元化资本将为后续多模态模型的持续迭代与升级,提供充足的算力支持与研发资源保障,助力其在人工智能赛道保持竞争力。