AI Agent 发展趋势与架构演进
从技术发展的脉络来看,编程范式一直在演进。记得Andrej Karpathy曾提出过一个观点——软件1.0时代,我们用Ja va、Python这些传统语言对计算机编程;到了2.0时代,编程变成了调整神经网络的参数权重。但大模型时代彻底改变了这一切,我们迎来了软件3.0时代。
这个时代的编程对象变成了大语言模型(LLM),它运行在GPU上,而不是传统的CPU。而编程语言也不再是Ja va、Go、Python,而是变成了提示词。没错,我们是通过提示词对LLM进行编程,最终产出的应用被称为AI原生应用。这种转变带来的是对开发范式和应用理解的全面重构,思维上的冲击远不止表面这些。
AI 原生应用的核心概念
对于这样一个全新概念,不少开发者还停留在模糊的认知阶段,不清楚AI原生应用的架构到底是什么样子。阿里云为此定义了一个AI原生应用开发全景图,帮助大家更系统地理解和探索。下面分块拆解一下。
AI Agent要真正运转起来,需要几个非常核心的能力:
- 感知:它需要感知内外环境,完成输入和输出;
- 大脑:通过大模型辅助决策;
- 工具:调用外部工具,包括使用MCP工具执行必要动作;
- 记忆:既有长期记忆,也有短期记忆,模型执行过程中的上下文是关键。
搞清楚了基础概念,接下来怎么开发AI Agent?
首先,需要趁手的开发框架来生成Agent的核心模块。主流开发语言都有不少框架,能极大简化开发步骤。同时,随着通义灵码、Cursor、Claude Code这类AI Coding工具逐渐成熟,低代码甚至成为了生成Agent的新路径。
Agent生成之后,需要计算资源来执行任务。它的运行时环境通常基于Kubernetes或者函数计算这类计算范式。实际操作中,任务执行所需要的模型推理以及MCP工具链的运作,都要依赖底层运行时环境的资源调度能力。
构建好运行时环境后,Agent底层架构还需要通用中间件能力来支撑核心服务。比如通过Nacos统一管理Prompt提示词,实现MCP的动态注册与发现;通过AI网关对多模型和MCP做集中袋里;还得借助消息队列完成长周期、多阶段任务的异步化改造。
最后,运行时环境的可观测性是保证系统稳定与持续优化的关键。Agent运行逻辑充满动态性和不确定性(比如多轮推理、事件驱动行为),因此需要用数据采集探针实时监控内部状态。LoongSuite开源探针就是干这个的,能采集token消耗、模型输入输出等信息。有了这些数据,就可以对AI Agent的性能、成本和质量做深入分析。