Nvidia đã ra mắt Nemotron 3 Ultra vào ngày 1 tháng 6 tại Computex ở Đài Bắc, một mô hình AI open-weight với 550 tỷ tham số, đánh dấu bản phát hành open AI lớn nhất của công ty cho đến nay. CEO Jensen Huang đã công bố mô hình trong bài phát biểu quan trọng, định vị đây là mô hình open-weight của Mỹ có thứ hạng cao nhất trên các thước đo về trí tuệ. Việc phát hành làm gia tăng cạnh tranh trong lĩnh vực AI open-weight, nơi các mô hình Trung Quốc bao gồm Kimi K2.6 của Moonshot AI hiện đang dẫn bảng xếp hạng trí tuệ toàn cầu, dù Nvidia có lợi thế về tốc độ.
Artificial Analysis, đơn vị đã hợp tác với Nvidia trong đánh giá trước khi phát hành, xếp Nemotron 3 Ultra ở mức 48 trên Intelligence Index. Chỉ số tổng hợp này gộp 10 bài đánh giá trải dài từ suy luận, lập trình, kiến thức chung đến hiệu suất agentic. Điểm số xác lập Nemotron 3 Ultra là mô hình open-weight hàng đầu của Mỹ, vượt qua Gemma 4 31B của Google (39), Nemotron 3 Super của chính Nvidia (36) và gpt-oss-120b của OpenAI (33).
Mô hình sử dụng kiến trúc mixture-of-experts với tổng cộng 550 tỷ tham số, nhưng chỉ kích hoạt 55 tỷ tham số vào bất kỳ thời điểm nào. Thiết kế này giúp giảm chi phí vận hành trong khi vẫn duy trì hiệu năng ở các tác vụ suy luận phức tạp.
Nemotron 3 Ultra đạt hơn 300 token đầu ra mỗi giây trên một endpoint DeepInfra tiền phát hành, theo thử nghiệm của Artificial Analysis. Các mô hình Trung Quốc trong cùng nhóm trí tuệ—DeepSeek V4 Pro và Kimi K2.6—hiện vận hành ở mức 50–100 token mỗi giây thông qua các API thương mại của họ. Nvidia cho biết mô hình chạy nhanh gấp 5 lần các lựa chọn open-weight tương đương, với chi phí thấp hơn 30%.
Kiến trúc kết hợp các lớp Mamba-2, attention Transformer tiêu chuẩn và cơ chế định tuyến mixture-of-experts. Mô hình hỗ trợ cửa sổ ngữ cảnh 1 triệu token và tích hợp multi-token prediction (MTP), tạo ra nhiều token tương lai đồng thời thay vì theo thứ tự tuần tự.
Kimi K2.6 của Moonshot AI giữ vị trí số 1 trong số các mô hình open-weight với điểm Intelligence Index là 54, cao hơn Nemotron 3 Ultra 6 điểm. Được phát hành vào tháng 4, Kimi K2.6 xếp thứ 4 toàn cầu trong số mọi mô hình AI, đứng sau các sản phẩm cờ hiệu độc quyền từ Anthropic, Google và OpenAI đúng 3 điểm, trong khi ba bên này đồng hạng ở 57.
Các mô hình open-source Trung Quốc đã tăng tỷ trọng trong việc sử dụng open-model toàn cầu từ khoảng 1,2% vào cuối năm 2024 lên khoảng 30% vào cuối năm 2025, theo báo cáo vào tháng 3.
Nvidia đã phát hành mô hình đầu tiên mang thương hiệu Nemotron vào tháng 11 năm 2023, và phiên bản thế hệ thứ ba được công bố vào tháng 12 năm 2025. Dòng sản phẩm gồm ba kích cỡ: Nano cho các tác vụ nhẹ, Super cho các ứng dụng doanh nghiệp tầm trung, và Ultra cho các tác vụ suy luận phức tạp. Cả ba mô hình đều dùng kiến trúc lai kết hợp các lớp Mamba-2, attention Transformer và định tuyến mixture-of-experts.
Nemotron 3 Super, ra mắt vào tháng 3 với 120 tỷ tham số, đạt 36 điểm trên Intelligence Index. Mức tăng 12 điểm của Nemotron 3 Ultra thể hiện bước tiến đáng kể trong dòng sản phẩm.
Nvidia đã công bố kế hoạch 5 năm chi 26 tỷ USD cho phát triển AI open-weight. Công ty thành lập Nemotron Coalition vào tháng 3, một nhóm gồm 8 phòng thí nghiệm AI bao gồm Mistral AI và Perplexity, nhằm đồng phát triển các open frontier model trên hạ tầng DGX Cloud. Nvidia cho biết họ đang làm việc trên Nemotron 4, thế hệ tiếp theo trong dòng mô hình.
Nemotron 3 Ultra sẽ được giao hàng vào ngày 4 tháng 6. Trọng số của mô hình sẽ được công khai và các công thức huấn luyện đang được phát hành. Người dùng có thể truy cập mô hình thông qua API của Nvidia hoặc các nhà cung cấp cloud mà không cần phần cứng trung tâm dữ liệu chuyên dụng.
Nemotron 3 Ultra của Nvidia đạt điểm trí tuệ bao nhiêu vào ngày 1 tháng 6?
Nemotron 3 Ultra đạt 48 điểm trên Artificial Analysis Intelligence Index, qua đó trở thành mô hình open-weight của Mỹ có thứ hạng cao nhất. Bảng benchmark tổng hợp 10 bài đánh giá bao phủ suy luận, lập trình, kiến thức chung và hiệu suất agentic.
Tốc độ của Nemotron 3 Ultra so với các mô hình Trung Quốc như thế nào?
Nemotron 3 Ultra đạt hơn 300 token đầu ra mỗi giây trên một endpoint DeepInfra tiền phát hành, trong khi các mô hình Trung Quốc DeepSeek V4 Pro và Kimi K2.6 vận hành ở mức 50–100 token mỗi giây thông qua các API thương mại.
Khi nào Nemotron 3 Ultra của Nvidia trở nên sẵn sàng?
Nemotron 3 Ultra sẽ được giao hàng vào ngày 4 tháng 6. Người dùng có thể truy cập mô hình thông qua API của Nvidia hoặc các nhà cung cấp cloud, với trọng số công khai và các công thức huấn luyện được phát hành.
Tin tức liên quan
Alphabet tìm cách huy động 80 tỷ USD để mở rộng hạ tầng AI
NVIDIA bắt tay với Unitree về thiết kế mẫu robot hình người H2+
Intel nhắm tới Nvidia và AMD với chip AI mới
NVIDIA ra mắt chip PC RTX Spark và CPU Vera tại COMPUTEX 2026
OpenAI công bố ra mắt bộ phận robot vào ngày 1 tháng 6