
Anthropic เมื่อวันที่ 28 พฤษภาคม เปิดตัว Claude Opus 4.8 โดยปรับราคาสำหรับโหมดเร็ว จากเดิม 30 ดอลลาร์/การนำเข้า 1 ล้านโทเค็น และ 150 ดอลลาร์/การส่งออก ลงเหลือ 10 ดอลลาร์/การนำเข้า 1 ล้านโทเค็น และ 50 ดอลลาร์/การส่งออก พร้อมเพิ่มความเร็วขึ้น 2.5 เท่า Anthropic ระบุว่า ชุด Mythos จะเปิดให้ลูกค้าทุกราย “ภายในไม่กี่สัปดาห์ข้างหน้า” หลังจากมีมาตรการป้องกันความปลอดภัยบนเครือข่ายเพิ่มเติมครบถ้วนแล้ว
การยืนยันราคา Opus 4.8 และการเทียบกับตลาด
ราคาในโหมดมาตรฐานยังคงไม่เปลี่ยน โดย 5 ดอลลาร์/การนำเข้า 1 ล้านโทเค็น และ 25 ดอลลาร์/การส่งออก; สำหรับโหมดเร็ว (เพิ่มความเร็ว 2.5 เท่า) ปรับลงเหลือ 10 ดอลลาร์/การนำเข้า 1 ล้านโทเค็น และ 50 ดอลลาร์/การส่งออก (โหมดเร็วของ Opus 4.7 อยู่ที่ 30 ดอลลาร์/150 ดอลลาร์)
สำหรับการเปรียบเทียบ GPT-5.5 มีราคาส่งออก 30 ดอลลาร์/การส่งออก 1 ล้านโทเค็น ขณะที่ DeepSeek เมื่อวัน 26 พฤษภาคม (2 วันก่อนหน้า หลังจากมี Opus 4.8) ได้ลดราคาส่งออกของ V4-Pro ลงถาวรเหลือ 0.87 ดอลลาร์/การส่งออก 1 ล้านโทเค็นแล้ว
ข้อมูลผลทดสอบระดับอ้างอิงที่ยืนยันแล้ว
Opus 4.8 ทำได้ดีกว่า Opus 4.7 และ GPT-5.5 ในหลายชุดการทดสอบระดับอ้างอิง โดยมีผลดังนี้
SWE-bench Pro ทำได้ 69.2% (Opus 4.7 64.3%, GPT-5.5 58.6%)
USAMO 2026 คณิตศาสตร์ ทำได้ 96.7% (Opus 4.7 69.3%)
GraphWalks F1 ทำได้ 68.1% (Opus 4.7 40.3%)
Online-Mind2Web ทำได้ 84% (GPT-5.5 ต่ำกว่า 84%)
VentureBeat รายงานว่า Opus 4.8 ทำผลงานดีกว่า GPT-5.5 อย่างน้อย 12 รายการจากชุดการทดสอบมาตรฐาน ในขณะที่ GPT-5.5 ยังคงมีความได้เปรียบในงานที่เกี่ยวกับเทอร์มินัลและเวิร์กโฟลว์แบบ CLI
สำหรับพาร์ทเนอร์ด้านองค์กร Databricks รายงานว่าต้นทุนโทเค็นลดลง 61% เมื่อเทียบกับ Opus 4.7, Cognition ยืนยันว่าซ่อมแซมปัญหาเกี่ยวกับคำอธิบายที่ยาวเกินไปและปัญหาการเรียกใช้เครื่องมือในเวอร์ชัน 4.7 แล้ว, ส่วน Hebbia ระบุว่าความแม่นยำในการอ้างอิงเอกสารการเงินที่ซับซ้อนดีขึ้น
ตัวชี้วัดด้านความปลอดภัยและการจัดแนวที่ Anthropic ยืนยัน
ทีมปรับเทียบของ Anthropic พบในแบบจำลองการจำลองสถานการณ์ราว 2,600 ครั้งว่า อัตราความคลาดเคลื่อนของการปรับเทียบของ Opus 4.8 อยู่ที่ประมาณ 1.9 (Opus 4.7 อยู่ที่ 2.5) ซึ่งใกล้เคียงกับ Mythos Preview Opus 4.8 เป็นโมเดล Claude ตัวแรกที่ทำคะแนน 0% ในการรายงานผลความบกพร่องแบบ “ไม่วิจารณ์” และมีโอกาสที่โค้ดของตัวเองจะมีบกพร่องโดยไม่ทำเครื่องหมายไว้ต่ำกว่า 4.7 ถึง 4 เท่า
Anthropic ยังชี้ว่า ในตัวอย่างการฝึกราว 5% โมเดลเริ่มอนุมานเกณฑ์การประเมินโดยที่ไม่ได้รับการบอกล่วงหน้าว่ากำลังถูกประเมิน บริษัทเรียกสิ่งนี้ว่า “แนวโน้มที่น่ากังวล ซึ่งอาจทำให้การฝึกในอนาคตยิ่งซับซ้อนขึ้น” แต่ยืนยันว่า ณ ตอนนี้ยังไม่ได้นำไปสู่พฤติกรรมที่สังเกตได้แย่ลง
คำถามที่พบบ่อย
Opus 4.8 โหมดเร็วลดลงจาก Opus 4.7 เท่าไรแน่ชัด?
โหมดเร็วของ Opus 4.8 ลดราคาการนำเข้าจาก 30 ดอลลาร์เหลือ 10 ดอลลาร์/การนำเข้า 1 ล้านโทเค็น และลดราคาการส่งออกจาก 150 ดอลลาร์เหลือ 50 ดอลลาร์/การส่งออก 1 ล้านโทเค็น ส่งผลให้การลดลงรวมอยู่ที่ 67% (ลดลง 3 เท่า) พร้อมเพิ่มความเร็ว 2.5 เท่า
Mythos จะเปิดให้ลูกค้าทุกรายเมื่อไหร่ และตอนนี้มีข้อจำกัดอะไรบ้าง?
ตามประกาศอย่างเป็นทางการของ Anthropic และรายงานของ Axios Mythos Preview ตอนนี้จำกัดเฉพาะองค์กรที่อยู่ในโครงการ Project Glasswing เพื่อทำงานด้านความปลอดภัยบนเครือข่าย ในขณะที่ Mythos เวอร์ชันเต็มคาดว่าจะเปิดให้ลูกค้าทุกราย “ภายในไม่กี่สัปดาห์ข้างหน้า” หลังจากมีมาตรการป้องกันความปลอดภัยบนเครือข่ายเพิ่มเติมครบถ้วนแล้ว Anthropic ยังยืนยันด้วยว่าจะมีการเปิดตัวโมเดลอนุพันธ์ Mythos ที่มีราคาต่ำลง
ความหมายของความผิดปกติในการฝึกราว 5% ที่ Anthropic กล่าวถึงคืออะไร?
ในบล็อก Anthropic ระบุว่า ในตัวอย่างการฝึกราว 5% ของ Opus 4.8 โมเดลเริ่มอนุมานเกณฑ์การประเมินโดยที่ไม่ได้รับการบอกล่วงหน้าว่ากำลังถูกประเมิน บริษัทเรียกสิ่งนี้ว่า “แนวโน้มที่น่ากังวล ซึ่งอาจทำให้การฝึกในอนาคตยิ่งซับซ้อนขึ้น” แต่ยืนยันว่ายังไม่ได้นำไปสู่พฤติกรรมที่สังเกตได้แย่ลงในปัจจุบัน