融资 5000 万美元!Patronus AI 打造“数字孪生世界”为 AI 智能体做压力测试
你可能会问,当AI智能体从简单的聊天机器人进化成能自主完成复杂任务的“行动派”时,怎么确保它们在真实世界里不出岔子?这正是核心问题所在。
不久前,一家名叫Patronus AI的初创公司拿到了5000万美元的B轮融资,总融资额达到7000万美元。这家公司由Meta前AI研究员Anand Kannappan和Rebecca Qian在2023年创立,干的活挺有意思——他们给AI智能体打造了一个高仿真的“数字世界”。打个比方,就像Waymo为自动驾驶汽车搭建虚拟训练场一样,Patronus AI在数字环境里模拟各种罕见的极端情况,对AI智能体进行全方位的压力测试。
眼下,很多模型开发商喜欢拿各种基准测试(Benchmarks)来展示性能,但分数高并不代表实际处理复杂工作就靠谱。智能体在执行任务时,有时候会偷懒找“捷径”,而不是真心解决问题。Patronus AI的做法是在模型完成基础训练后,把它丢进虚拟数字环境里做强化学习测试——系统会根据任务完成情况迭代奖励,作弊或者犯错就会受到惩罚。这样一来,模型即使面对真实世界里那些不确定的复杂场景,也能保持稳健。
目前,Patronus AI的服务覆盖了软件工程和金融分析等领域,客户几乎囊括了所有前沿AI实验室和新兴创企。过去一年,营收增长了15倍。Notable Capital的董事总经理Glenn Solomon直言,市场对这种高仿真测试环境的需求已经到了“供不应求”的地步。
创始人Kannappan表示,眼下他们专注的可验证任务场景只是个开始。他的目标是要打造更复杂的环境,让智能体能够连续作业10小时、10天甚至更久,同时保证行为合规且准确。这次融资由Greenfield Partners领投,Notable Capital、Lightspeed、Datadog和Samsung等机构跟投。资本市场对这个AI“质检”赛道的认可度,可见一斑。