微软新推 Fara1.5 系列智能体模型,任务成功率高达 72%!超越 OpenAI!
浏览器智能化的赛道,最近又迎来了一位重量级选手。微软研究院AI Frontiers实验室正式发布了全新的Fara1.5系列智能体模型,专为浏览器场景打造,目标直指提升我们日常使用计算机的自动化与智能化水平。这个系列一口气推出了三个不同参数规模的版本:4B、9B和27B,以满足不同场景下的性能与效率需求。
那么,它是如何工作的?关键在于与MagneticLite沙盒浏览器的配合。Fara1.5能够直接“看懂”浏览器的实时截图,并通过模拟人类的鼠标点击和键盘输入,自动执行网页上的各种操作。其核心工作逻辑遵循一个经典的“观察—思考—行动”循环。在每一步决策中,模型都会结合历史对话记录以及最近的三张浏览器截图,进行推理分析,然后生成下一步的具体动作指令。这种设计让它能更好地理解动态变化的网页状态。
性能表现是硬道理。在权威的Online-Mind2Web基准测试中,Fara1.5-27B版本取得了高达72%的任务成功率。这个数字是什么概念?它显著超越了OpenAI的Operator(58.3%)和谷歌的Gemini 2.5 Computer Use(57.3%)等强劲对手。更值得注意的是,即便是参数规模较小的Fara1.5-9B版本,其成功率也达到了63.4%,表现依然相当亮眼。高效的任务完成能力,让Fara1.5系列在当前的智能体竞争中占据了有利位置。
强大的能力背后,是精心构建的训练数据。Fara1.5使用了大约200万条样本进行微调,数据来源非常多元:约60%来自真实的网页操作轨迹,12.8%来自合成环境,12.5%与用户交互相关,8.8%用于事实锚定训练,还有4.9%来源于视觉问答。这种丰富、多维度的数据混合策略,极大地提升了模型对复杂、真实网络环境的适应性和综合智能水平。
当然,能力越强,责任越大,安全性是重中之重。Fara1.5内置了明确的安全护栏,在三种关键情况下会主动暂停操作并向用户确认:一是当任务涉及缺失的个人信息时;二是当任务描述本身模糊不清时;三是当即将执行的操作是未经用户明确批准的不可逆行为时。此外,所有的操作过程都被严格限制并记录在MagneticLite沙盒环境中,这相当于在智能体与用户的真实设备之间建立了一道坚固的安全边界,有效保障了隐私和数据安全。
随着技术的持续迭代,微软Fara1.5系列的推出,无疑为我们勾勒了一个更智能、更便捷的未来浏览体验。它再次证明了,人工智能在赋能日常计算机使用方面,正展现出巨大而切实的潜力。