エストニア言語研究所によれば、政府が後援する組織が最近、「プロパガンダ耐性(Propaganda Resistance)」という新しいベンチマークのランキングを公開し、ロシアの戦略的な言説に立場を取らない能力について、大規模言語モデルを数十件評価した。最先端モデルの中では、AnthropicのClaudeモデルが最も好成績を収め、Claude Opus 4.7は100点満点中94.9点を獲得し、テスト質問の77%で「模範的(Exemplary)」の評価を受けた。このベンチマークでは、ロシアの影響作戦を14のカテゴリに分けてLLMの回答を評価し、クリミアの地位からNATOの歴史までのテーマを扱った。