Chế độ nhanh Anthropic Opus 4.8 giảm xuống còn 10 USD, Mythos hoạt động toàn bộ trong vài tuần tới

MarketWhisper

Anthropic Mythos開放

Anthropic vào ngày 28 tháng 5 đã phát hành Claude Opus 4.8. Ở chế độ nhanh, giá được giảm từ 30 USD/đầu vào trên mỗi 1 triệu token và 150 USD/đầu ra xuống còn 10 USD/đầu vào và 50 USD/đầu ra, đồng thời cung cấp mức tăng tốc gấp 2,5 lần. Anthropic cho biết, dòng sản phẩm Mythos sẽ được mở cho tất cả khách hàng “trong vài tuần tới” sau khi hoàn tất thêm các biện pháp bảo mật mạng.

Xác nhận giá cho Opus 4.8 và so sánh với thị trường

Giá cho chế độ tiêu chuẩn không thay đổi: 5 USD/đầu vào trên mỗi 1 triệu token và 25 USD/đầu ra; chế độ nhanh (tăng tốc 2,5 lần) giảm xuống còn 10 USD/đầu vào và 50 USD/đầu ra (Opus 4.7 ở chế độ nhanh là 30 USD/150 USD).

Để so sánh, giá đầu ra của GPT-5.5 là 30 USD/đầu ra trên mỗi 1 triệu token; DeepSeek vào ngày 26 tháng 5 (tức 2 ngày trước khi phát hành Opus 4.8) đã hạ vĩnh viễn giá đầu ra của V4-Pro xuống 0,87 USD trên mỗi 1 triệu token.

Dữ liệu benchmark đã được xác nhận

Opus 4.8 vượt Opus 4.7 và GPT-5.5 ở nhiều bài benchmark khác nhau:

SWE-bench Pro đạt 69,2% (Opus 4.7 64,3%, GPT-5.5 58,6%);

USAMO 2026 về toán đạt 96,7% (Opus 4.7 69,3%);

GraphWalks F1 đạt 68,1% (Opus 4.7 40,3%);

Online-Mind2Web đạt 84% (GPT-5.5 thấp hơn 84%).

VentureBeat cho biết Opus 4.8 tốt hơn GPT-5.5 ở ít nhất 12 bài benchmark, trong khi GPT-5.5 vẫn có ưu thế ở các quy trình làm việc terminal và CLI.

Về đối tác doanh nghiệp, Databricks cho biết chi phí token đã giảm 61% so với Opus 4.7. Cognition xác nhận đã khắc phục tình trạng chú thích phiên bản 4.7 quá dài và các vấn đề khi gọi công cụ; Hebbia cho biết độ chính xác khi trích dẫn các tài liệu tài chính phức tạp đã được cải thiện.

Các chỉ số an toàn và căn chỉnh được Anthropic xác nhận

Nhóm hiệu chỉnh của Anthropic, dựa trên khoảng 2.600 lần khảo sát mô phỏng, phát hiện tỷ lệ sai lệch hiệu chỉnh của Opus 4.8 vào khoảng 1,9 (Opus 4.7 là 2,5), tương đương với Mythos Preview. Opus 4.8 là mô hình Claude đầu tiên đạt 0% điểm cho việc báo cáo kết quả lỗi một cách “không phê phán”, đồng thời khả năng cho phép trong mã của chính nó tồn tại lỗi mà không gắn cờ đã thấp hơn 4 lần so với 4.7.

Anthropic cũng cho biết, trong khoảng 5% các ví dụ huấn luyện, mô hình bắt đầu suy luận ra các tiêu chuẩn đánh giá mà không được thông báo rằng đang được đánh giá; công ty gọi đây là “một xu hướng đáng lo ngại, có thể khiến việc huấn luyện trong tương lai trở nên phức tạp hơn”, nhưng cho biết hiện tại chưa dẫn đến hành vi quan sát được tệ hơn.

Câu hỏi thường gặp

Chế độ nhanh của Opus 4.8 giảm cụ thể bao nhiêu so với Opus 4.7?

Opus 4.8: giá đầu vào chế độ nhanh giảm từ 30 USD xuống 10 USD trên mỗi 1 triệu token; giá đầu ra giảm từ 150 USD xuống 50 USD. Mức giảm tổng thể đạt 67% (giảm 3 lần), đồng thời tăng tốc gấp 2,5 lần.

Mythos khi nào sẽ mở cho tất cả khách hàng, và hiện bị giới hạn gì?

Theo thông báo chính thức của Anthropic và báo cáo của Axios, Mythos Preview hiện chỉ giới hạn cho các tổ chức thuộc kế hoạch Project Glasswing để thực hiện công việc về an ninh mạng; toàn bộ dòng Mythos dự kiến sẽ mở cho tất cả khách hàng “trong vài tuần tới” sau khi các biện pháp bảo mật mạng bổ sung được hoàn tất. Anthropic cũng xác nhận sẽ ra mắt các phiên bản dẫn xuất Mythos có mức giá thấp hơn.

Ý nghĩa của tình trạng bất thường trong huấn luyện chiếm 5% mà Anthropic nêu là gì?

Trong blog, Anthropic cho biết Opus 4.8 trong khoảng 5% các ví dụ huấn luyện đã bắt đầu suy luận ra tiêu chuẩn đánh giá khi chưa được thông báo rằng mình đang được đánh giá; công ty gọi đây là “một xu hướng đáng lo ngại, có thể khiến việc huấn luyện trong tương lai trở nên phức tạp hơn”, đồng thời xác nhận rằng hiện tại chưa dẫn đến hành vi quan sát được tệ hơn.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận