Theo phân tích blog mới nhất của Nvidia, GPU Blackwell có chi phí gần gấp đôi theo giờ so với thế hệ Hopper, nhưng lại mang đến chi phí suy luận theo mỗi token thấp hơn 35 lần. Dùng DeepSeek-R1 làm mô hình thử nghiệm, Blackwell (GB300 NVL72) cho thuê ở mức 2,65 USD mỗi GPU mỗi giờ, trong khi Hopper là 1,41 USD. Tuy nhiên, thông lượng trên một GPU tăng từ 90 lên 6.000 token mỗi giây. Mức tăng thông lượng 65 lần này làm giảm chi phí theo 1 triệu token từ 4,20 USD xuống 0,12 USD.
Con số 0,12 USD giả định tối ưu phần mềm đầy đủ, bao gồm suy luận độ chính xác thấp FP4 và dự đoán đa token (MTP). Nếu không bật MTP, chi phí theo 1 triệu token đạt khoảng 2,35 USD, sau đó giảm xuống 0,11 USD khi bật tính năng này, cho thấy chỉ riêng MTP đã tạo ra tác động tối ưu 21 lần.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Cơ quan Lao động Mỹ ra mắt cổng thông tin AI cho người học việc để giúp doanh nghiệp đào tạo nhân lực
Bộ Lao động Hoa Kỳ khởi động cổng thông tin AI cho chương trình học nghề trên toàn quốc vào Tuần lễ Học nghề, cung cấp nguồn tài nguyên đào tạo một cửa. Thông qua khung năng lực AI, cổng này chuyển đổi sang kỹ năng thực hành, thiết kế các mô-đun cho nhiều ngành và lộ trình linh hoạt, giúp doanh nghiệp tích hợp đào tạo AI vào chương trình học nghề đã đăng ký, nhằm nâng cao năng lực nhân lực và sức cạnh tranh của ngành.
ChainNewsAbmedia13phút trước
X Ra mắt Nền tảng quảng cáo AI được xây dựng lại vào tháng 4 năm 2026, Cải tổ lớn nhất trong 20 năm
Theo X, nền tảng này đã bắt đầu triển khai theo giai đoạn một nền tảng quảng cáo được xây dựng lại vào tháng 4/2026. Động thái này đánh dấu đợt đại tu hệ thống quảng cáo lớn nhất của họ trong khoảng 20 năm khi công ty chuyển nhiều công cụ quảng cáo hơn sang AI. Ads Manager mới sử dụng nhắm mục tiêu và xếp hạng dựa trên AI, dựa trên
GateNews1giờ trước
Intel tăng 114% trong tháng 4 nhờ kết quả kinh doanh mạnh mẽ và kỳ vọng về AI
Theo CNBC, cổ phiếu Intel đã tăng 114% trong tháng 4, ghi nhận tháng tốt nhất theo kỷ lục, được thúc đẩy bởi lợi nhuận theo quý mạnh hơn và sự lạc quan trở lại của nhà đầu tư về đợt phục hồi liên quan đến AI. Cổ phiếu đã tăng 24% vào ngày 24 tháng 4 sau khi CEO Lip-Bu Tan công bố rằng doanh thu theo quý tăng hơn 7%, trong khi
GateNews1giờ trước
Marathon Digital Holdings sẽ mua Long Ridge Energy với 1,5 tỷ USD để mở rộng trung tâm dữ liệu AI
Marathon Digital Holdings đang mua lại Long Ridge Energy với giá 1,5 tỷ USD để mở rộng năng lực trung tâm dữ liệu AI. Thỏa thuận bao gồm một nhà máy điện khí tự nhiên công suất 505 MW và 1.600 mẫu đất tại Ohio, cung cấp hơn 1 GW công suất để hỗ trợ cơ sở hạ tầng AI và CNTT trong tương lai.
GateNews1giờ trước
OpenClaw Phát hành v2026.4.29 vào ngày 29 tháng 4, Nâng cấp Bộ nhớ lên Wiki Cá nhân hóa với Theo dõi Quan hệ
Theo Beating, trợ lý AI mã nguồn mở OpenClaw (GitHub 367K lượt sao) đã phát hành v2026.4.29 vào ngày 29/4, đánh dấu bản cập nhật thứ hai trong vòng hai ngày. Hệ thống bộ nhớ đã phát triển từ cơ chế gợi nhớ dựa trên truy xuất đơn giản sang wiki được cá nhân hóa, cho phép các tác nhân tự động xây dựng hồ sơ nhân vật và theo dõi r
GateNews2giờ trước
Musk làm chứng rằng xAI đã sử dụng các mô hình OpenAI để huấn luyện Grok
Elon Musk đã làm chứng vào hôm thứ Năm tại tòa án liên bang ở California rằng công ty trí tuệ nhân tạo của ông, xAI, đã sử dụng một phần các mô hình của OpenAI khi huấn luyện chatbot Grok, theo TechCrunch. Thừa nhận này là một sự công khai hiếm hoi của một nhà phát triển AI lớn về một thực hành đang ngày càng gia tăng
CryptoFrontier5giờ trước