最先把 AI OS 带给 14 亿人的,居然是微信?
微信的 AI,终于有了实质性的动作。
就在苹果 WWDC 的同一天,微信默默发布了一份看似朴实无华的公告——《关于开发者接入微信 AI 生态的指引》。但仔细一看,这事的分量,可能比苹果那一整个发布会还重。

从这一刻起,小程序开发者可以授权给微信 AI,让后者完成读取、操作和调用小程序的一系列功能。微信提供了两种接入路径,一种是「自动模式」,门槛几乎为零——开发者只需打开一个开关,平台会自动扫描代码、分析页面结构、搞懂这个小程序的完整能力,然后 AI 就能直接上手操作,一行代码都不用写。另一种是「开发模式」,开发者自己动手开发定制化的 Skill,通过审核后交由 AI 调用。两种模式可以同时开启,美团已经宣布接入。
这不能仅仅理解成又一个新功能上线。信号很明确:
微信正在把它的整个生态——数百万小程序、微信支付、服务通知、公众号——转化为 AI 的执行层。
扒一扒 Skill 文档:微信 AI 是怎么调小程序的
微信开放文档里公开了小程序接入 AI 的 Skill 技术规范,仔细翻一翻,里面藏着不少设计细节。
官方 skill 文档路径如下:
https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

从架构上看,做过 AI 开发的人会立刻认出它的本质——就是 MCP。mcp.json 声明每个原子接口的功能和参数,SKILL.md 描述整个业务流程如何运转,这和 Claude、Cursor、VS Code 里的 MCP+Skills 架构几乎是一个模子刻出来的。
微信没有另起炉灶,而是直接采用了行业正在收敛的标准。
在指导方案里,微信给出了一套相当清晰的「注意力权重」体系。AI 在决定调用哪个接口、生成什么参数时,最优先参考的是接口返回的 content(权重五星),其次是 mcp.json 里的接口 description(四星)和参数 description(四星),SKILL.md 排在最后(三星)。这其实在告诉开发者:写在哪里,比写了什么更重要——同样一条规则,写在接口返回里和写在 SKILL.md 里,AI 赋予的权重天差地别。

接口返回层面有一条核心规范:「事实+动作」两段式。先告诉 AI「发生了什么」,再告诉它「下一步做什么」。如果只写动作不写事实,AI 很可能把「展示卡片」误解成「准备调下一个接口」,直接跳过用户确认。这是一个踩过无数次坑之后才能总结出来的规则。

参数传递方面,优先使用 ID 而非自然语言。以图中的「咖啡点单」场景为例,用户提出需求后,AI 理解模糊意图、处理选项调整、规格变更、完成支付,全程不出对话框。
这套设计的潜台词很清晰:
微信已经在实战中跑过足够多的 case,清楚 AI 调用外部服务的每一个坑,并且把这些经验沉淀成了开发者规范。
实际上,如果拿同样以「生态」著称的微信小程序和苹果应用做对比,微信对自家生态有一种「上帝视角」,这是一切实现的前提。
为什么比苹果 AI 还重要
今年苹果在 WWDC 上发布的新版 Siri AI,虽然底层接入了 Google Gemini,Shortcuts 也支持了自然语言创建,但并没有引起太多讨论。

细看就能发现差距所在:苹果做的是让 AI 在 iOS 系统内协调一些原生功能,一旦涉及到第三方应用——那些装在你手机上的 App——它就会力不从心。比如饿了么,它的代码跑在自己的服务器上,苹果读不了。Siri 想调用饿了么,必须等饿了么的工程师主动来对接 App Intents 这套接口,一家一家谈、一个一个接,中间的时间和技术成本都不小。

而微信的做法是让 AI 直接操作数百万个第三方服务——关键就在于小程序的特殊架构。
每个小程序的代码,从开发者提交、到微信审核、再到最终在用户手机上运行,全程都在微信的技术体系里。
所以「自动模式」才能成立——开发者一行代码不用写,开个开关,微信就能自动把你的小程序翻译成 AI 可调用的工具。微信的基础架构天然支持这种能力,
它拥有「上帝视角」,能够基于中心化实现调度。
这个架构优势,苹果没有,Google 也没有。
同样值得关注的,还有前不久传出的消息:微信正在与华&为、荣耀、小米、OPPO、vivo 合作推出 A2A(Agent-to-Agent)助手能力,用户可以通过手机语音助理直接发起微信音视频通话或发消息。

对内,微信 AI 可以调用数百万小程序;对外,手机厂商的 AI 助理可以调用微信。
微信正在成为 AI 时代的超级连接器,一个所有 AI 都能接入的服务中枢。
「微信 OS」的旧预言
小程序刚推出的时候,很多人戏称微信要做「微信 OS」。当时这更像一个修辞——小程序确实替代了一部分 App 的功能,但本质上还是一个「轻应用平台」。更巧合的是,当时设计的中心化审核机制,初衷是为了控制质量和安全。但九年后,这个当初被批评为「管控过度」的设计,意外地成了 AI 时代的基础设施优势。分布式的 App 生态(苹果/Android)当时看起来更「自由」,现在反而成了 AI 接入的障碍。

一个旧的预言,因为新时代的技术——AI——的到来,产生了碘伏性的变化。
此前讨论 OpenClaw 和飞书时,行业里有过一个判断:IM 是 AI Agent 最天然的入口,因为
对话本身就是人与 AI 最自然的交互方式

不过,飞书始终是企业协作工具,覆盖的是办公场景。而微信的广度截然不同——14.32 亿月活,数百个细分领域的小程序,从点外卖到挂号到买机票到缴水电费,几乎覆盖了一个人日常生活的全部服务需求。

如果微信 AI 真的能流畅地调用这些小程序完成任务,那么就像那个旧预言所说的,它成了一个可以用自然语言操作的操作系统。用户说一句「帮我订明天下午三点从北京到上海的高铁」,AI 就能拆解意图,调用 12306 小程序查票、选座、通过微信支付完成下单,全程不出微信。这条链路理论上今天就可以跑通。
当然,理论和现实之间还有距离。AI 调用涉及支付场景的服务,容错率接近零——点错一杯咖啡是小事,买错一张机票就是大事。底层模型在精确性上的要求,远高于对话场景。这也是全球 AI Agent 落地面临的共同瓶颈:从「能聊天」到「能办事」,中间隔的不是技术指标,是信任。

但微信至少做对了一件事:它没有从零搭建服务网络。这些年,ChatGPT 的做法是先有一个聪明的脑子,再一个一个去接 Shopify、DoorDash、Stripe,每一个连接都是从零开始,到今天交易相关查询的占比还不到 3%。
真正将要发生的变化,对大多数用户来说,可能是悄无声息的。某一天你在微信里随口敲一句「帮我订今晚九点去上海的票」,然后它就订好了,
你甚至不会知道背后调用了哪个小程序,走了什么支付流程。
这种「无感知的完成」,才是 AI Agent 真正成熟的标志。而微信,离这一步比任何人都近。