Anthropic เปิดตัว Claude Sonnet 5 เมื่อวันที่ 1 กรกฎาคม และตั้งเป็นโมเดลดีฟอลต์สำหรับผู้ใช้ Free และ Pro ราคามาตรฐาน API อยู่ที่ 3 ดอลลาร์ต่อ 1 ล้าน token สำหรับ input และ 15 ดอลลาร์สำหรับ output ส่วนราคาโปรโมชันถึงวันที่ 31 สิงหาคมคือ input 2 ดอลลาร์ output 10 ดอลลาร์ เมื่อเทียบกับรุ่นเรือธง Opus 4.8 ราคามาตรฐานถูกกว่าประมาณ 60%
Claude Sonnet 5 มี context window สูงสุด 1 ล้าน token และ output สูงสุด 128k token เวอร์ชันนี้ใช้ tokenizer ที่อัปเดตแล้ว Anthropic ระบุว่าข้อมูลนำเข้าเดียวกันภายใต้ tokenizer ใหม่จะสร้าง token เป็น 1.0 ถึง 1.35 เท่าของรุ่นก่อน ขึ้นอยู่กับเนื้อหา Anthropic อ้างว่าราคาได้ถูกปรับให้ 'เป็นกลางด้านต้นทุนโดยประมาณ' และแนะนำให้ผู้ใช้ที่มีปริมาณการใช้งานสูงทำการทดสอบ benchmark ของตนเองเพื่อประเมินผลกระทบต่อค่าใช้จ่ายจริง
ข้อมูลทั้งหมดด้านล่างนี้มาจาก Anthropic อย่างเป็นทางการ ยังไม่มีรายงานการตรวจสอบจากบุคคลที่สามที่เป็นอิสระ
SWE-bench Pro (agentic coding): Sonnet 5 63.2%, Opus 4.8 69.2%, Sonnet 4.6 58.1%
Terminal-Bench 2.1 (การควบคุม terminal): Sonnet 5 80.4%, Opus 4.8 82.7%
Humanity's Last Exam (การให้เหตุผลหลายสาขาวิชา พร้อมเครื่องมือ): Sonnet 5 57.4%, Opus 4.8 57.9%
GDPval-AA v2 (งานความรู้): Sonnet 5 ได้คะแนน 1,618; Opus 4.8 ได้คะแนน 1,615
OSWorld-Verified (การควบคุมคอมพิวเตอร์): Sonnet 5 81.2%, Sonnet 4.6 78.5%
การประเมินช่องโหว่ Firefox 147: Sonnet 5 อัตราการสร้างช่องโหว่ที่ใช้ได้ 0%, ความสำเร็จบางส่วน 13.2%; Sonnet 4.6 ความสำเร็จบางส่วน 8.8%; Opus 4.8 อยู่ที่ 68.8%
รายงานความปลอดภัยของ Anthropic ระบุว่า Claude Sonnet 5 เมื่อเทียบกับ Sonnet 4.6 มีอาการประสาทหลอน (hallucination) และแนวโน้มการประจบสอพลอ (sycophancy) ต่ำกว่า มีความสามารถในการปฏิเสธคำขอที่มุ่งร้ายมากขึ้น และเวอร์ชันนี้ได้เปิดใช้งานกลไกป้องกันความปลอดภัยทางเครือข่ายเป็นค่าเริ่มต้น รายงานยังชี้ว่า Sonnet 5 มีอัตราการเกิดพฤติกรรมที่ไม่เหมาะสมสูงกว่า Opus 4.8 และสูงกว่า Claude Mythos Preview เวอร์ชันที่มีข้อจำกัดเข้มงวดด้วย
Anthropic ตั้งเป็นโมเดลดีฟอลต์สำหรับผู้ใช้ Free และ Pro ในวันเดียวกับที่เปิดตัว Claude Sonnet 5 อย่างเป็นทางการเมื่อวันที่ 1 กรกฎาคม 2026
คะแนน benchmark ทั้งหมดของ Claude Sonnet 5 ที่ Anthropic เปิดเผยเป็นข้อมูลที่ประเมินเองอย่างเป็นทางการ Anthropic ไม่ได้ให้รายงานการตรวจสอบจากบุคคลที่สามที่เป็นอิสระ และไม่ได้ระบุไทม์ไลน์ที่คาดว่าจะส่งตรวจสอบจากบุคคลที่สาม
Anthropic ระบุว่าข้อมูลนำเข้าเดียวกันภายใต้ tokenizer ใหม่จะสร้าง token เป็น 1.0 ถึง 1.35 เท่าของรุ่นก่อน ทางการอ้างว่าราคาได้ถูกปรับให้ 'เป็นกลางด้านต้นทุนโดยประมาณ' Anthropic แนะนำให้ผู้ใช้ที่มีปริมาณการใช้งานสูงทำการทดสอบ benchmark ของตนเองเพื่อประเมินผลกระทบต่อค่าใช้จ่ายจริง และไม่ได้การันตีว่าบิลจะไม่เพิ่มขึ้นในทุกสถานการณ์
news.related.news
Meituan โอเพนซอร์ส LongCat-2.0: พารามิเตอร์ 1.6 ล้านล้าน ไม่ต้องใช้ GPU NVIDIA
Google เปิดตัวโมเดลสร้างภาพต้นทุนต่ำที่สุด ราคา 0.034 ดอลลาร์ต่อพันภาพ
Anthropic Fable 5 ฟื้นฟูการเข้าถึงของผู้ใช้ การควบคุมการส่งออกโมเดล AI ครั้งแรกของสหรัฐฯ สิ้นสุดลง
Meta AI แปลงความคิดเป็นข้อความมีความแม่นยำถึง 61% พร้อมปล่อยโค้ดโอเพนซอร์สพร้อมกัน
ช่องโหว่โควตาของ Codex ล่มอีกครั้ง OpenAI ดำเนินการฮาร์ดรีเซ็ตครั้งที่สอง