โหมดเร็วของ Anthropic Opus ลดลงเหลือ 10 ดอลลาร์ ขณะที่ Mythos เปิดให้ใช้งานเต็มรูปแบบภายในไม่กี่สัปดาห์

MarketWhisper

2026-05-29 03:46:23

Anthropic เมื่อวันที่ 28 พฤษภาคม เปิดตัว Claude Opus 4.8 โดยปรับราคาสำหรับโหมดเร็ว จากเดิม 30 ดอลลาร์/การนำเข้า 1 ล้านโทเค็น และ 150 ดอลลาร์/การส่งออก ลงเหลือ 10 ดอลลาร์/การนำเข้า 1 ล้านโทเค็น และ 50 ดอลลาร์/การส่งออก พร้อมเพิ่มความเร็วขึ้น 2.5 เท่า Anthropic ระบุว่า ชุด Mythos จะเปิดให้ลูกค้าทุกราย “ภายในไม่กี่สัปดาห์ข้างหน้า” หลังจากมีมาตรการป้องกันความปลอดภัยบนเครือข่ายเพิ่มเติมครบถ้วนแล้ว

การยืนยันราคา Opus 4.8 และการเทียบกับตลาด

ราคาในโหมดมาตรฐานยังคงไม่เปลี่ยน โดย 5 ดอลลาร์/การนำเข้า 1 ล้านโทเค็น และ 25 ดอลลาร์/การส่งออก; สำหรับโหมดเร็ว (เพิ่มความเร็ว 2.5 เท่า) ปรับลงเหลือ 10 ดอลลาร์/การนำเข้า 1 ล้านโทเค็น และ 50 ดอลลาร์/การส่งออก (โหมดเร็วของ Opus 4.7 อยู่ที่ 30 ดอลลาร์/150 ดอลลาร์)

สำหรับการเปรียบเทียบ GPT-5.5 มีราคาส่งออก 30 ดอลลาร์/การส่งออก 1 ล้านโทเค็น ขณะที่ DeepSeek เมื่อวัน 26 พฤษภาคม (2 วันก่อนหน้า หลังจากมี Opus 4.8) ได้ลดราคาส่งออกของ V4-Pro ลงถาวรเหลือ 0.87 ดอลลาร์/การส่งออก 1 ล้านโทเค็นแล้ว

ข้อมูลผลทดสอบระดับอ้างอิงที่ยืนยันแล้ว

Opus 4.8 ทำได้ดีกว่า Opus 4.7 และ GPT-5.5 ในหลายชุดการทดสอบระดับอ้างอิง โดยมีผลดังนี้

SWE-bench Pro ทำได้ 69.2% (Opus 4.7 64.3%, GPT-5.5 58.6%)

USAMO 2026 คณิตศาสตร์ ทำได้ 96.7% (Opus 4.7 69.3%)

GraphWalks F1 ทำได้ 68.1% (Opus 4.7 40.3%)

Online-Mind2Web ทำได้ 84% (GPT-5.5 ต่ำกว่า 84%)

VentureBeat รายงานว่า Opus 4.8 ทำผลงานดีกว่า GPT-5.5 อย่างน้อย 12 รายการจากชุดการทดสอบมาตรฐาน ในขณะที่ GPT-5.5 ยังคงมีความได้เปรียบในงานที่เกี่ยวกับเทอร์มินัลและเวิร์กโฟลว์แบบ CLI

สำหรับพาร์ทเนอร์ด้านองค์กร Databricks รายงานว่าต้นทุนโทเค็นลดลง 61% เมื่อเทียบกับ Opus 4.7, Cognition ยืนยันว่าซ่อมแซมปัญหาเกี่ยวกับคำอธิบายที่ยาวเกินไปและปัญหาการเรียกใช้เครื่องมือในเวอร์ชัน 4.7 แล้ว, ส่วน Hebbia ระบุว่าความแม่นยำในการอ้างอิงเอกสารการเงินที่ซับซ้อนดีขึ้น

ตัวชี้วัดด้านความปลอดภัยและการจัดแนวที่ Anthropic ยืนยัน

ทีมปรับเทียบของ Anthropic พบในแบบจำลองการจำลองสถานการณ์ราว 2,600 ครั้งว่า อัตราความคลาดเคลื่อนของการปรับเทียบของ Opus 4.8 อยู่ที่ประมาณ 1.9 (Opus 4.7 อยู่ที่ 2.5) ซึ่งใกล้เคียงกับ Mythos Preview Opus 4.8 เป็นโมเดล Claude ตัวแรกที่ทำคะแนน 0% ในการรายงานผลความบกพร่องแบบ “ไม่วิจารณ์” และมีโอกาสที่โค้ดของตัวเองจะมีบกพร่องโดยไม่ทำเครื่องหมายไว้ต่ำกว่า 4.7 ถึง 4 เท่า

Anthropic ยังชี้ว่า ในตัวอย่างการฝึกราว 5% โมเดลเริ่มอนุมานเกณฑ์การประเมินโดยที่ไม่ได้รับการบอกล่วงหน้าว่ากำลังถูกประเมิน บริษัทเรียกสิ่งนี้ว่า “แนวโน้มที่น่ากังวล ซึ่งอาจทำให้การฝึกในอนาคตยิ่งซับซ้อนขึ้น” แต่ยืนยันว่า ณ ตอนนี้ยังไม่ได้นำไปสู่พฤติกรรมที่สังเกตได้แย่ลง

คำถามที่พบบ่อย

Opus 4.8 โหมดเร็วลดลงจาก Opus 4.7 เท่าไรแน่ชัด?

โหมดเร็วของ Opus 4.8 ลดราคาการนำเข้าจาก 30 ดอลลาร์เหลือ 10 ดอลลาร์/การนำเข้า 1 ล้านโทเค็น และลดราคาการส่งออกจาก 150 ดอลลาร์เหลือ 50 ดอลลาร์/การส่งออก 1 ล้านโทเค็น ส่งผลให้การลดลงรวมอยู่ที่ 67% (ลดลง 3 เท่า) พร้อมเพิ่มความเร็ว 2.5 เท่า

Mythos จะเปิดให้ลูกค้าทุกรายเมื่อไหร่ และตอนนี้มีข้อจำกัดอะไรบ้าง?

ตามประกาศอย่างเป็นทางการของ Anthropic และรายงานของ Axios Mythos Preview ตอนนี้จำกัดเฉพาะองค์กรที่อยู่ในโครงการ Project Glasswing เพื่อทำงานด้านความปลอดภัยบนเครือข่าย ในขณะที่ Mythos เวอร์ชันเต็มคาดว่าจะเปิดให้ลูกค้าทุกราย “ภายในไม่กี่สัปดาห์ข้างหน้า” หลังจากมีมาตรการป้องกันความปลอดภัยบนเครือข่ายเพิ่มเติมครบถ้วนแล้ว Anthropic ยังยืนยันด้วยว่าจะมีการเปิดตัวโมเดลอนุพันธ์ Mythos ที่มีราคาต่ำลง

ความหมายของความผิดปกติในการฝึกราว 5% ที่ Anthropic กล่าวถึงคืออะไร?

ในบล็อก Anthropic ระบุว่า ในตัวอย่างการฝึกราว 5% ของ Opus 4.8 โมเดลเริ่มอนุมานเกณฑ์การประเมินโดยที่ไม่ได้รับการบอกล่วงหน้าว่ากำลังถูกประเมิน บริษัทเรียกสิ่งนี้ว่า “แนวโน้มที่น่ากังวล ซึ่งอาจทำให้การฝึกในอนาคตยิ่งซับซ้อนขึ้น” แต่ยืนยันว่ายังไม่ได้นำไปสู่พฤติกรรมที่สังเกตได้แย่ลงในปัจจุบัน

news.article.disclaimer

news.related.news

12 ชั่วโมง ที่แล้ว

Microsoft ยกเลิกไลเซนส์ Claude Code เนื่องจากต้นทุนสูง โดยลูกค้าจ่าย $500M ต่อเดือนสำหรับ AI ในเดือนพฤษภาคม 2026

13 ชั่วโมง ที่แล้ว

Anthropic เปิดตัวโมเดลระดับ Mythos รุ่นถัดไปภายในไม่กี่สัปดาห์หลังความก้าวหน้าด้านความปลอดภัย

21 ชั่วโมง ที่แล้ว

Anthropic วางแผนนำโมเดลระดับ Mythos มาให้ลูกค้าทุกรายภายในไม่กี่สัปดาห์ข้างหน้า หลังเสริมมาตรการความปลอดภัย

btc.bar.articles

คณะกรรมาธิการสหภาพยุโรปวางแผนเจรจากับ Anthropic เพื่อขอสิทธิ์การเข้าถึง Mythos

Market Whisper11 ชั่วโมง ที่แล้ว

Aave Labs เสนอกรอบเกณฑ์มาตรฐานด้านเทคนิค โดยมีการจำกัดการเปิดใช้งานสำหรับสินทรัพย์ที่มีช่องโหว่ทางเทคนิคสำคัญ