Claude Sonnet 5 上线,API 定价比 Opus 便宜六成

Anthropic 于 7 月 1 日发布 Claude Sonnet 5,并将其设为 Free 与 Pro 用户的预设模型。API 标准定价为每百万 token 输入 3 美元、输出 15 美元,8 月 31 日前优惠期定价为输入 2 美元、输出 10 美元;对比旗舰 Opus 4.8 标准定价便宜约六成。

Claude Sonnet 5 的 API 定价、优惠期限与 tokenizer 说明

Claude Sonnet 5 的 context window 上限为 100 万 token,最大输出达 128k token。此版本采用更新版 tokenizer,Anthropic 说明相同输入在新 tokenizer 下产生的 token 数量为前代的 1.0 至 1.35 倍,视内容而定。Anthropic 声称定价已调整为「大致成本中性」,并建议高流量用户自行执行基准测试以评估实际账单影响。

Anthropic 公布的 6 项基准测试数据

以下数据均来自 Anthropic 官方,尚未有第三方独立验证报告:

SWE-bench Pro(agentic 代码):Sonnet 5 63.2%,Opus 4.8 69.2%,Sonnet 4.6 58.1%

Terminal-Bench 2.1(终端机操控):Sonnet 5 80.4%,Opus 4.8 82.7%

Humanity's Last Exam(多学科推理,搭配工具):Sonnet 5 57.4%,Opus 4.8 57.9%

GDPval-AA v2(知识工作):Sonnet 5 得分 1,618;Opus 4.8 得分 1,615

OSWorld-Verified(电脑操控):Sonnet 5 81.2%,Sonnet 4.6 78.5%

Firefox 147 漏洞评估:Sonnet 5 可用漏洞产出率 0%,部分成功率 13.2%;Sonnet 4.6 部分成功率 8.8%;Opus 4.8 为 68.8%

Anthropic 安全报告中 Sonnet 5 的安全指标

Anthropic 的安全报告指出,Claude Sonnet 5 相较 Sonnet 4.6,幻觉(hallucination)与谄媚倾向(sycophancy)更低,拒绝恶意请求的能力更强,且此版本已预设启用网络安全防护机制。报告同时指出,Sonnet 5 在不当行为发生率上仍高于 Opus 4.8,也高于严格限制版的 Claude Mythos Preview。

常见问题

Claude Sonnet 5 何时设为 Free 与 Pro 用户的预设模型?

Anthropic 于 2026 年 7 月 1 日正式发布 Claude Sonnet 5 的同日,将其设为 Free 与 Pro 用户的预设模型。

Anthropic 公布的跑分是否有第三方验证?

Anthropic 公布的所有 Claude Sonnet 5 跑分均为官方自评数据。Anthropic 未提供第三方独立验证报告,亦未说明预计提交第三方验证的时间表。

新版 tokenizer 对 API 用户账单有何影响?

Anthropic 说明相同输入在新 tokenizer 下产生的 token 数量为前代的 1.0 至 1.35 倍,官方声称定价已调整为「大致成本中性」。Anthropic 建议高流量用户自行执行基准测试,以评估实际账单影响,并未保证所有场景下账单不会上升。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论