一张卡,10分钟,这家公司把地球玩成了《我的世界》!
从古巴比伦的泥板地图算起,人类对物理世界的记录与重构,已经延续了数千年。从羊皮纸海图到二维卫星影像,再到手机里司空见惯的导航地图,每一步都在把庞大复杂的真实世界压缩进小小的载体中。
但进入AI的深水区,传统方式突然不够用了。
如今,看地图的不再只是人——自动驾驶汽车的传感器、低空物流无人机的“大脑”、具身智能机器人的决策中枢,它们需要的是一个拥有物理法则、具备几何深度、高度真实还原的三维世界。
很长一段时间里,构建3D城市的方式是“采集拟合”。这昂贵且低效,需要无数无人机拍摄海量照片,靠庞大算力集群计算点云,再靠人工修补那些“融化”的建筑和树木。
难道这是唯一的方式吗?
6月8日,高德发布了全球首个3D原生城市世界模型——ABot-Earth0.5。这项技术宣告了城市级场景3D原生技术的重要突破,更彻底重塑了传统3D建模的生产逻辑与成本结构。

百分之一的成本,千倍的提效
说到3D地球,行业标杆一直是Google Earth。高质量的3D地球建模被视为只有巨头才能承担的“奢侈工程”,传统方案需要数年积累、上百亿投入。
但现在,AI带来了效率与成本的底层质变。ABot-Earth0.5的出现,让3D生成效率对传统方式形成了“降维打击”。
过去,要生成一平方公里的高保真3D城市模型,需要等待晴天派无人机航拍,获取数万张照片,再喂给上百台高性能服务器组成的算力集群,最后还需大量外包人员人工精修。一套标准3D城市生成动辄数小时到数天,成本高到只有大型市政项目或巨头企业才能承担。
ABot-Earth0.5的3D原生模式从根本上简化了这一流程,击穿了传统成本壁垒。

只要任意模态输入(图像、文本、3D模型),ABot-Earth0.5就能在消费级GPU上,10分钟内让一座具备真实地理与几何一致性的3D城市拔地而起——效率提升1000倍。3D城市的生产周期,正式进入“按分钟交付”的时代。
凭借这种碘伏性生产力,ABot-Earth0.5目前已悄然建成全球覆盖面积最广的3D地图,遍及190多个国家和地区。

过去,高保真3D模型是“奢侈品”;现在,它变成了“工业标准件”。
告别“中间商”,直达原生渲染
如果仅仅是快和便宜,那可能只是牺牲质量换来的妥协。但ABot-Earth0.5生成的3D城市,较人工重建的水准也不遑多让。
传统由照片生成的3D模型,输出格式往往是点云或多边形网格,再贴上一层2D纹理贴图。这种格式远看还能糊弄眼睛,一旦拉近,建筑边缘的锯齿、植被的几何扭曲就会暴露无遗。更重要的是,导入现代游戏引擎或工业仿真软件时,往往需要极为繁琐的格式转换和二次优化。
ABot-Earth0.5的3D原生模式则完全不同。它的输出不再是粗糙的网格和贴图,而是原生可渲染、工程可用的3DGS资产。

这带来了两个显著优势。第一,极高的保真度。树叶的缝隙、水波的反射、建筑的复杂纹理,在几千万个高斯基元的描绘下栩栩如生。第二,高工程可用性。生成的3D城市可以直接导入Unity或Unreal Engine等主流引擎中无缝使用——没有繁琐的“中间商赚差价”,没有格式转换的数据流失。

为什么只有高德做得出来?
既然3DGS原生世界模型这么强大,为什么之前没有人做出来?为什么偏偏是高德拔得头筹?

要回答这个问题,需要一次深度的技术拆解。你会发现,ABot-Earth0.5的诞生并非偶然,而是路径选择、工程能力与数据壁垒共同催生的结果。高德做成这个模型,靠的是二十年积累的真实空间技术和数据,以及对3D原生路线的坚定押注。
打破神话的“真实时空数据”
在AI浪潮中,数据是决定模型想象力的天花板。不同于大语言模型遍布整个以太网的数据量,空间智能模型所需要的真实3D数据量级严重不足。这催生了数据采集工厂和合成数据产业,行业内有些大模型就是通过游戏引擎生成的虚拟数据进行训练的。
但要生成真实的“世界模型”,合成数据是靠不住的。地球并非由规则的几何体拼接而成,真实城市的肌理充满了复杂性:毫无规律生长的庞杂植被、高低错落的非标准建筑、在阳光下折射出不同光影的河流湖泊……如果只用合成数据去喂养AI,它永远只能学会建造一个不可靠且“塑料感”十足的乐高城市,因为它无法理解真实世界的地理规律。
而这道鸿沟,恰恰是高德的强项——数据护城河。高德作为扎根物理世界二十余年的科技企业,拥有其他纯科技公司难以企及的庞大、真实的空间数据储备。ABot-Earth0.5训练数据源于高德沉淀的海量时空数据,它的每一次训练,都在吸收真实城市的地理与几何先验。它学习的不是“如何画一栋楼”,而是“真实世界中的楼是如何与街道、树木、光影共存的”——这从根本上保证了生成内容的“地理一致性”和“几何一致性”。这条用时间与脚步丈量出来的数据护城河,是任何后来者都无法在短期内靠砸钱买算力来赶超的。

抛弃“2D蒸馏”,直击“原生3D理解”
在ABot-Earth0.5之前,学术界和工业界探索3D生成,普遍走的是“曲线救国”的道路:从2D图像蒸馏3D结构。先让大模型看海量2D照片,然后让它“猜”物体的3D长什么样。这种方法生成一个苹果、一张椅子等物品级3D模型还勉强凑合,但用来生成包含万物、结构极其复杂的城市,AI会瞬间陷入混乱,产出充满幻觉和几何谬误的模型。
既然要建构3D世界,为什么不直接让AI用3D的方式去思考?高德采用的就是一条全新开辟的技术栈——直接以海量3DGS数据训练模型,让AI从一开始就形成对三维空间的原生理解,从而在单张卫星图条件下,端到端直接生成3DGS格式的城市场景。
工程破局:ABot-Earth0.5的四重突破
理论很丰满,但要让原生3DGS模型真正落地为工业级产品,需跨越数据表征、尺度交互、空间连续与条件适配四大工程挑战。高德通过系统性架构设计,逐一突破,率先跑通了城市级3D原生场景的端到端生成链路。

挑战一:3D表示差异
现有生成器大多为处理3D网格(Mesh)设计。但真实户外场景到处都是树木、水体这类充满“复杂非流形拓扑”的东西,用Mesh表示就像用保鲜膜去包裹一棵树,根本包不住。3DGS(数百万无序的高斯基元)能完美还原这些细节,但它太庞大、太无序,现有AI根本咬不动。高德为此首创了直接在3DGS表示上进行操作的“压缩-生成”框架——给极其复杂的3DGS数据做一个超级ZIP压缩包,编码到紧凑的隐空间中,让AI轻松推理和生成,再解压成全新的高质量场景。
挑战二:多尺度交互渲染
地球级的场景,不能只能远观。用户需要从上帝视角的宏观城市,一秒钟俯冲到微观的街道细节中去。这种连续的LOD漫游,是之前“物品级”生成器连想都不敢想的。高德设计了原生多层次细节(LOD)解码器,将LOD直接集成到生成过程中。

不需要生成完再花大把时间做后处理,AI在生成城市的那一刻,就已经把宏观和微观的层次结构建好了——这为流畅的、实时的在线漫游提供了强大的原生支持。
挑战三:大范围空间连续性
要生成公里级的大范围场景,AI的显存会被瞬间撑爆,所以必须分块生成。但分块生成就像把不同人织的毛衣布料拼在一起,必然出现刺眼的接缝。高德提出了高效的“基于滑窗的无缝推理策略”——AI在生成相邻地块时,会在重叠区域进行智能融合算法处理,就像一个手法高超的裁缝,在针脚交汇处做了完美过渡,消除了拼接痕迹,真正实现了公里级甚至更大范围的连续构建。
挑战四:条件鲁棒性
全球各地卫星影像清晰度不同、颜色不同、拍摄倾角不同,有的甚至还有云层遮挡。卫星图和AI训练用的航拍图之间存在巨大的“域差异”。如何让模型在看到任何一张质量参差不齐的真实卫星图时,都能稳定发挥?高德独创了跨域自适应条件注入策略:训练时,刻意模拟卫星视角去渲染航拍重建数据,让模型提前适应这种“模糊感”;推理时,引入强大的视觉语言模型(VLM)作为“适配器”,动态调整、校准输入的真实卫星影像特性。

这种强大的鲁棒性,确保了ABot-Earth0.5在面对任意一张图时,都能生成高可信度的3D场景。
这四项技术并非孤立优化,而是构成了一套完整的城市级3D原生生成工程体系。相较于学术界常见的实验性探索,高德首次在工业尺度上打通了从3D数据表征、连续生成到多条件适配的完整链路,验证了前沿3D生成算法走向规模化、低成本落地的工程可行性。
空间智能的工程落地,已经全面开始
当惊叹于ABot-Earth0.5的技术亮点时,更应该退后一步,看看这项技术发布背后所隐含的巨大产业风暴。空间智能技术的成熟,正在推动多个产业进入新的发展阶段。
补齐AI理解世界的最后一块拼图
过去两年,大语言模型证明了AI在语言理解和逻辑推演上取得了历史性突破。但文字终究是人类文明的抽象符号。如果AI要真正融入人类的物理世界,就必须具备理解空间、生成空间、在空间中行动的能力——这就是全球顶级科技圈都在追逐的圣杯:空间智能。
高德的ABot-Earth0.5用实打实的工程成果,证明了AI在推断和生成复杂物理空间结构上的惊人突破。

如果说大模型让机器学会了“说话”,那么ABot-Earth0.5就是让机器学会了“睁眼看世界”并“在脑海中构建世界”。两者的结合,标志着AI的进化正式从二维数字空间,跨入了三维物理世界。
场景落地:千行百业的生产力重构
技术突破的最终归宿是产业落地。ABot-Earth0.5以其惊人的速度、极低的成本和直接沉淀3D模型资产的能力,正在对多个产业带来结构性的碘伏。
具身智能:打通机器人仿真的“任督二脉”
传统虚拟仿真环境存在致命缺陷:要么“太假”,机器人学不到真实的物理反馈;要么追求高保真,但人工建模成本高昂,动辄耗时数月、花费百万,且场景单一,无法覆盖长尾边缘场景。
ABot-Earth0.5的出现,就像为具身智能打通了任督二脉。只需几分钟,它就能根据真实数据生成物理精确的3D城市——真实的台阶高度、路面坑洼的几何起伏、树木与建筑的遮挡关系、甚至光影的反射,都能被精准还原。更关键的是,它能生成指数级的训练场景:输入不同文本或图像指令,就能瞬间生成“下雨积水的十字路口”、“满是杂物的狭窄巷道”等无数种复杂的合成数据环境。这彻底改变了机器人训练的逻辑——ABot-Earth0.5不再只是一个制图工具,它正在成为具身智能时代不可或缺的底层世界模拟器。
低空经济:以极低成本铺设“天空之城的隐形轨道”
无人机物流、eVTOL为代表的低空经济是当下最火热的万亿级战略赛道。但要让成千上万的飞行器在城市上空安全穿梭,依靠传统2D平面地图无异于盲人摸象。低空飞行需要精确到厘米级的3D全域地图来规划航线、规避障碍物。然而传统3D测绘成本极高、更新极慢,根本无法覆盖广袤且时刻变化的全域低空。
ABot-Earth0.5彻底打低了低空经济的基建成本。仅需输入常规卫星图或普通航拍图,它就能在极短时间内、以近乎为零的边际成本,生成覆盖全域的高保真3D基底。更关键的是,它还解决了城市“生长”带来的难题——昨天没有的塔吊,今天可能就成了致命障碍。凭借“按分钟交付”的极速能力,ABot-Earth0.5能够实现低空地图的高频甚至实时更新,为每一架无人机铺设安全、精准的隐形轨道。
智慧政务与应急响应:与时间赛跑的生命通道
在地震、洪水等灾害发生时,灾区地貌往往发生巨大改变。救援黄金72小时内,每一分钟都极其宝贵。传统测绘需要漫长的数据处理,等3D模型建好,救援时机早已错失。这正是ABot-Earth0.5发挥极限价值的生死场。前方只需用普通无人机飞一圈传回影像,或者仅凭几张现场照片,指挥中心利用单张显卡,10分钟内就能生成灾后现场的1:1三维结构全景。救援人员可以在瞬间生成的3D沙盘上精准测算泥石流土方量、寻找安全直升机降落点、规划不会被二次滑坡波及的生命通道、甚至分析洪水淹没的立体范围。
在常规城市治理中,这种能力同样带来质的飞跃。过去的违建排查、老旧小区改造需要大量人力实地丈量;现在,通过ABot-Earth0.5快速生成城市高保真3D孪生底座,规划部门可以一键模拟新建高楼对周边小区的日照遮挡。真正的“数字孪生城市”,因为ABot-Earth0.5的低门槛,实现了普惠应用。
高德,用想象力重塑边界
ABot-Earth0.5的发布,是高德长期技术积累的集中体现。大众对高德的传统认知,是一个好用的导航软件,是一个地理信息的记录者。但随着高德首款机器人“高德途途”和全栈具身技术体系ABot的亮相,高德持续向世界展示了其深厚的技术底蕴。而ABot-Earth0.5正是ABot体系的重要补充和能力放大。
凭借以ABot技术体系为核心的空间智能算法上的持续突破,高德的边界正在无限延伸——它正在从“记录物理世界”的数字制图者,进化为“生成物理世界”的空间智能引擎。过去,高德告诉你“世界长什么样”;而在未来,高德的技术将能够为AI和千行百业“按需生成这个世界”。
ABot-Earth0.5的发布,已经让空间智能规模化落地成为可能。
一张图,十分钟,一座城。这在昨天听起来像是科幻小说的情节,在今天已经成为可以用代码运行、用显卡计算的真实工程。3D城市建模的旧有范式已被打破,高德作为先行者和定义者,已经推开了那扇通往三维新世界的大门。