首页 > 教程攻略 > 热点新闻 >Claude Sonnet 5 登场,部分性能逼近 Opus 4.8

Claude Sonnet 5 登场,部分性能逼近 Opus 4.8

来源:互联网 时间:2026-07-01 10:58:07

7月1日,Anthropic 正式发布了 Claude Sonnet 5,号称是 Sonnet 系列中智能体能力最强的模型。简单说,它能自主制定计划、调用浏览器和终端这类工具,然后直接跑起来——不再只是回答问题,而是真正能干活的那种。

费用方面,模型已经上线,接入了 Claude Code 和 Claude Platform。开发者调用 API 时,指定“claude-sonnet-5”就能直接用。

技能这块,它是 Anthropic 目前“最具智能体能力”的 Sonnet 模型。能规划执行步骤,能操控浏览器和终端,而且以自主方式运行——换句话说,你给它一个目标,它能自己连招,不用你一步一催。

性能提升才是硬指标。在智能体搜索评测 BrowseComp、计算机使用评测 OSWorld-Verified 等项目中,Sonnet 5.0 相比 Sonnet 4.6 进步非常明显,甚至在部分任务上已经接近 Opus 4.8 的水平。这说明什么?说明中间的差距在快速缩小,Sonnet 系列正一步步逼近旗舰。

安全方面,Anthropic 给出了正面数据:Sonnet 5 整体不良行为发生率低于 Sonnet 4.6,在恶意请求拒绝、提示注入攻击抵抗、幻觉率和迎合性这几个维度上都有改善。简单理解就是,它更安全、更不容易被“带偏”,也更少胡编乱造。