Google DeepMind Phát hành Gemma 4 12B, Mô hình đa phương thức mã nguồn mở chạy trên GPU 16GB

Google DeepMind hôm nay đã phát hành Gemma 4 12B, một mô hình AI đa phương thức mã nguồn mở. Mô hình 12 tỷ tham số mang lại hiệu năng tương đương với mô hình Mixture of Experts 26B lớn hơn, trong khi yêu cầu bộ nhớ ít hơn một nửa, và có thể chạy trên laptop phổ thông với chỉ 16GB VRAM, bao gồm cả các thiết bị MacBook Air M5 cấp nhập môn.

Gemma 4 12B là mô hình cỡ trung đầu tiên trong dòng Gemma 4 hỗ trợ đầu vào âm thanh nguyên bản. Mô hình có kiến trúc nhẹ, không có các bộ mã hóa tách riêng cho tầm nhìn và âm thanh, giúp giảm độ trễ và giảm mức tiêu thụ bộ nhớ. Mô hình hỗ trợ suy luận nhiều bước, quy trình làm việc cho Agent, và suy luận cục bộ hoàn toàn offline. Mô hình được phát hành theo giấy phép Apache 2.0, với trọng số đã huấn luyện sẵn có trên Hugging Face và Kaggle, đồng thời có thể được triển khai thông qua các nền tảng Google Cloud, bao gồm Model Garden, Cloud Run và GKE.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận