探索智能新边界!灵光在手机端上线“体验世界模型”功能
一张照片,一部手机,你就能在AI构建的世界里自由漫步。这听起来像是科幻电影里的场景,但如今,它已经走进了现实。
4月27日,蚂蚁灵光App正式上线了“体验世界模型”功能,成为业界首个让普通用户在移动端就能亲手体验世界模型的AGI产品。操作简单得惊人:你只需上传一张图片,就能在手机上开启一段最长60秒的3D世界探索之旅。更妙的是,整个过程就像玩一款手游——你可以用手游摇杆操控视角,在里面随意走动、环顾四周。而从你发出指令到开始探索,整个过程只需要秒级响应。这不仅意味着“世界模型”这个高大上的概念首次在手机端跑了起来,其分钟级的长时一致性和实时交互体验,也再次为AGI产品的落地树立了新的标杆。

(图说:在灵光APP中,点击左下角「➕」号上传图片,再点击「生成图中世界」,即可开启体验)
在AI领域,世界模型被广泛视为通向AGI(通用人工智能)的关键路径之一,它本质上是连接数字虚拟世界与物理现实世界的一座桥梁。此次灵光App上线的功能,其背后引擎是蚂蚁的灵波LingBot-World-Fast世界模型。值得一提的是,这个强大的模型已经对外开源,为行业的发展提供了重要的基础设施。
那么,具体怎么玩呢?灵光App设计了一个极其便捷的入口。打开应用,在对话框里上传一张你心仪的照片,系统会智能地推荐几个操作指令,你只需选择“生成图中世界”即可。或者,你也可以更随心所欲,直接输入“帮我用第一人称视角探索这个世界”这样的自然语言,系统同样能理解并自动启动世界模型的生成流程。指令发出,几乎是眨眼之间,探索就开始了。
进入生成的世界后,你会发现体验非常流畅。产品团队针对移动端的使用习惯做了大量优化,其中最亮眼的设计,就是引入了手游式的摇杆操控。屏幕左侧的虚拟摇杆控制角色移动,你可以前后左右自由行走;右侧摇杆则负责转动视角,让你能360度观察这个即时生成的3D环境。这套操作逻辑与市面上主流的3D手游如出一辙,用户几乎不需要任何学习成本,就能立刻沉浸其中,真正做到了“零门槛”。
当然,将世界模型部署到移动端,从来都不是一件容易的事。巨大的算力需求、苛刻的延迟控制、以及终端设备性能的参差不齐,每一个都是实实在在的工程难题。为了攻克这些挑战,灵光团队采用了高效的低延迟流式传输技术,将响应延迟压缩到了百毫秒级别。正是这种技术突破,使得“秒级开启探索”成为可能,彻底打破了以往业界认为世界模型“高门槛、高算力、难落地”的固有印象。
灵光App的负责人蔡伟在谈及这一功能时表示,这是团队在探索智能边界道路上的又一次重要实践。他提到,此前灵光推出的“闪应用”功能,已经实现了用自然语言30秒生成一个应用,本质上是将专业开发者的编码能力赋予了普通用户。而此次的世界模型功能,延续了同样的理念:不断挖掘用户那些尚未被满足的深层需求,致力于将顶尖的AI体验带给每一个人。
目前,这款充满想象力的功能已经面向所有用户开放。感兴趣的话,可以直接在各大应用商店下载灵光App,亲自体验一下用手机漫步AI世界的奇妙感觉。