Phát hành Step Audio 2.5 Realtime: Điểm đánh giá chủ quan 80,41, vượt GPT-Realtime-1.5 tới 18%, cuộc gọi thoại có chi phí 3,8 Nhân dân tệ/giờ

Theo Beating, Step Audio 2,5 Realtime, một mô hình giọng nói thời gian thực end-to-end của Step Cosmos, đã ra mắt trên API nền tảng mở của họ vào tháng 4 năm 2026. Mô hình tập trung vào hội thoại tự nhiên với các nhân cách nhân vật có thể tùy chỉnh và khả năng nhận biết tín hiệu cận ngôn ngữ (giọng điệu, ngắt quãng, tiếng thở dài).

Trong thử nghiệm chính thức trên năm tiêu chí, Step Audio 2,5 Realtime xếp hạng số 1 ở tất cả các hạng mục. Điểm đánh giá chủ quan (các cuộc trò chuyện trên ứng dụng điện thoại do người dùng thật thực hiện) đạt 80,41, so với 68,01 của GPT-Realtime-1,5 và 67,16 của Gemini Live. Chuẩn đo giọng nói Q&A đạt 79,80, gần gấp 1,5 lần 53,20 của GPT-Realtime-1,5. Giá API: 10 nhân dân tệ cho mỗi 1 triệu token đầu vào (2 nhân dân tệ khi cache hit), 70 nhân dân tệ cho mỗi 1 triệu token đầu ra, với ước tính cuộc gọi giọng nói liên tục ở mức 3,8 nhân dân tệ mỗi giờ.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

TCI Fund Bán Giảm Gần $8B Cổ Phiếu Microsoft, Trích Dẫn Rủi Ro Từ AI

Theo Financial Times, quỹ phòng hộ của Chris Hohn là TCI gần đây đã thoái gần 8 tỷ USD cổ phiếu Microsoft. Quỹ này cho biết với nhà đầu tư rằng trí tuệ nhân tạo là một mối đe dọa đối với vị thế thống trị của Microsoft trong phần mềm.

GateNews41phút trước

Tessera Labs hoàn tất vòng gọi vốn $60M do a16z dẫn dắt

Theo Odaily, công ty khởi nghiệp tự động hóa bằng AI Tessera Labs đã công bố hoàn tất vòng gọi vốn 60 triệu USD do Andreessen Horowitz (a16z) dẫn dắt, với sự tham gia của Foundation Capital, Myriad Venture Partners và Osage University Partners. Nền tảng AI-native của công ty tự động hóa cho doanh nghiệp

GateNews2giờ trước

Kẻ tấn công chèn 575 kỹ năng độc hại vào Hugging Face và ClawHub bằng 13 tài khoản

Theo CISO của Mist Security @im23pds, các kẻ tấn công gần đây đã xâm nhập 13 tài khoản để chèn 575 Skills độc hại vào Hugging Face và ClawHub (OpenClaw), như đã được công bố trên nền tảng X.

GateNews2giờ trước

DeepSeek dự định huy động tối đa 50 tỷ RMB trong vòng gọi vốn kỷ lục, mô hình V4.1 dự kiến ra mắt vào tháng 6

Theo PANews vào ngày 8 tháng 5, DeepSeek dự kiến huy động tối đa 50 tỷ RMB trong vòng gọi vốn đầu tiên, qua đó đánh dấu thương vụ gọi vốn đơn lẻ lớn nhất của một công ty AI Trung Quốc. Nhà sáng lập kiêm CEO Liang Wenfeng dự kiến sẽ đóng góp số tiền tối đa. Công ty có kế hoạch đẩy nhanh việc phát triển các mô hình ngôn ngữ lớn m

GateNews3giờ trước

Sportix hoàn tất vòng gọi vốn 3,2 triệu USD do Coinvestor Ventures và Animoca Brands dẫn dắt

Theo ChainCatcher, nền tảng hạ tầng AI cho thể thao Sportix đã hoàn tất vòng gọi vốn trị giá 3,2 triệu USD. Vòng này được dẫn dắt bởi Coinvestor Ventures, với sự tham gia của Animoca Brands, Becker Ventures, X21 Digital và Alpha Capital. Sportix cho biết họ sẽ sử dụng số tiền để thúc đẩy AI của mình

GateNews3giờ trước

Chi phí dữ liệu huấn luyện cho robot giảm 65% kể từ năm 2024, giảm từ 340 USD xuống 118 USD mỗi giờ

Theo Cointelegraph, chi phí dữ liệu huấn luyện robot đã giảm 65% kể từ năm 2024, giảm từ 340 USD/giờ xuống còn 118 USD/giờ tính đến năm 2026.

GateNews3giờ trước
Bình luận
0/400
Không có bình luận