为什么数 AI Agent 数量是虚荣指标:AIAA 才是正确度量
一组让人坐不住的数据

Shopify 2026 Q1 财报显示:来自 AI 搜索的订单同比增长约
13 倍
BrightEdge 的报告同样触目惊心:AI Agent 活动已占网站总流量的约
15%
88%
看到这些数字,几乎所有人的第一反应都是:
我们网站被多少 AI Agent 访问了?
但我们想说这个问题,
问错了。
一、Agent 身份从根本上是不稳定的
就拿 ChatGPT 来说,它至少以四种完全不同的方式访问你的网站:
访问形态 | 特征 |
GPTBot(爬虫) | 抓取产品页面,不执行 JS,不带 session cookie,GA4 甚至不会将其记为一次会话 |
ChatGPT-User(浏览器模式) | 访问退货政策页,可能执行部分 JS,但 User-Agent 与 GPTBot 完全不同 |
用户点击链接 | 用户在 ChatGPT 对话中点进你的网站,这是一个带 referrer 的常规浏览器会话 |
API / MCP 调用 | 如果你开放了结构化数据接口,它会通过服务端 tool-calling 直接读取 |
同一个 AI 平台,四种访问形态。说它是一个 Agent,还是四个?
更麻烦的是,每种识别方法都只给你看一个碎片:
- UA 只能识别部分爬虫
- 反向 DNS 只对固定 IP 段有效
- referrer 只在点击场景下存在
- IP 还会变
没有任何一种方法能可靠地告诉你「这就是一个 Agent 实例」。
BrightEdge 的数据进一步加深了这个问题的复杂性:在所有 AI Agent 流量中,
95% 来自 OpenAI 系统
二、数量不等于商业价值
来看看两个场景的对比:
场景 A
→
商业价值:零。
场景 B
→
1 个 Agent、1 次访问,产生了真实收入。
如果你的北极星指标是 "Active Agents = 5",你根本无法区分这两种场景。
用 "Active Agents" 来代表 AI 的商业影响,就像用
快递单数量来代表一家公司的收入
三、行业正在度量"动作",而不是"Agent 数量"
看看正在形成的行业标准实际在观察什么:
- 定义了
OpenTelemetry GenAI 语义约定
invoke_agent、execute_tool和tool call作为 trace/span 对象 - 追踪 traces、spans 和 tool calls
OpenAI Agents SDK
它们度量的是执行动作,不是 Agent 数量。
这不是巧合,而是行业在用实践告诉我们:真正有意义的是
发生了什么
谁来了
四、一个更精准的度量框架:AIAA
我们需要一个更精确的指标:
AI-Attributed Active Actions(AI 归因有效动作)
AIAA
AIAA 不数有多少 AI 在动,它数的是
有证据支撑的 AI 相关动作发生了多少
Answer → Request → Visit → Commerce → Attribution
第一层:Answer(应答)
AI 在回答用户问题时提到了你的品牌、引用了你的页面,或吸收了你的产品信息。这是
曝光层
第二层:Request(请求)
AI Agent 直接访问了你的网站——爬取产品页、读取价格、检查库存或退货政策。这是
机器行为层
第三层:Visit(访问)
用户通过 AI 推荐链接到达了你的网站。这是
人类到达层
第四层:Commerce(商业行为)
到达的访客在网站上产生了商业意图行为:产品浏览、加购、发起结账、完成购买。这是
商业价值层
2 倍
第五层:Attribution(归因)
一笔订单可以通过完整的证据链回溯到 AI 来源:AI referrer → 网站会话 → 订单。这是
商业价值最高的层级
五、Active Agents 应该放在哪里?
Active Agents 并非无用——它应该成为
AIAA 内部的一个分析维度
对比两种汇报方式:
"这个月我们多了 3 个 AI Agent"
→ 告诉你一个可能不稳定、不可比较的数字在变化
"这个月 AIAA Visit 层增长了 120%"
→ 告诉你商业结果在变化
这不是一个指标选择问题,而是一个决策质量问题。
AI 时代的营销度量正在重构。你们团队目前如何衡量 AI 带来的流量价值?