Anthropic Claude 在 LLM 新型反宣传基准测试中登顶

据爱沙尼亚语言研究所称,政府资助的机构近期发布了一个新的“宣传抵抗力”基准排名,对几十个大型语言模型在其避免站队俄方战略叙事的能力方面进行了评估。安息香公司(Anthropic)的 Claude 模型在前沿模型中表现最佳,其中 Claude Opus 4.7 在 100 分中得分 94.9,并在 77% 的测试问题中获得“杰出”评级。该基准在 14 个类别的俄方影响行动中评估了 LLM 的回答,涵盖从克里米亚地位到北约历史等主题。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论