Anthropic Claude คว้าชนะเกณฑ์วัดความทนทานต่อโฆษณาชวนเชื่อฉบับใหม่สำหรับ LLMs

ตามสถาบันภาษาเอสโตเนีย องค์กรที่ได้รับการสนับสนุนจากรัฐบาลเมื่อไม่นานนี้ได้เผยแพร่การจัดอันดับตัวชี้วัดใหม่ด้าน “Propaganda Resistance” ที่ประเมินความสามารถของโมเดลภาษาขนาดใหญ่หลายสิบตัวในการหลีกเลี่ยงการเข้าข้างในประเด็นเล่าเรื่องเชิงยุทธศาสตร์ของรัสเซีย แอนโทรปิก (Anthropic) โดยโมเดลตระกูล Claude ทำผลงานได้ดีที่สุดในกลุ่มโมเดลระดับแนวหน้า โดย Claude Opus 4.7 ได้คะแนน 94.9 จาก 100 และได้เรตติ้ง “Exemplary” ใน 77 เปอร์เซ็นต์ของคำถามในการทดสอบ การจัดอันดับดังกล่าวประเมินคำตอบของ LLM ใน 14 หมวดหมู่ที่เกี่ยวข้องกับปฏิบัติการโฆษณาชวนเชื่อของรัสเซีย ตั้งแต่หัวข้อเกี่ยวกับสถานะของไครเมีย ไปจนถึงประวัติศาสตร์ของ NATO
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น