Google DeepMind hôm nay đã phát hành Gemma 4 12B, một mô hình AI đa phương thức mã nguồn mở. Mô hình 12 tỷ tham số mang lại hiệu năng tương đương với mô hình Mixture of Experts 26B lớn hơn, trong khi yêu cầu bộ nhớ ít hơn một nửa, và có thể chạy trên laptop phổ thông với chỉ 16GB VRAM, bao gồm cả các thiết bị MacBook Air M5 cấp nhập môn.
Gemma 4 12B là mô hình cỡ trung đầu tiên trong dòng Gemma 4 hỗ trợ đầu vào âm thanh nguyên bản. Mô hình có kiến trúc nhẹ, không có các bộ mã hóa tách riêng cho tầm nhìn và âm thanh, giúp giảm độ trễ và giảm mức tiêu thụ bộ nhớ. Mô hình hỗ trợ suy luận nhiều bước, quy trình làm việc cho Agent, và suy luận cục bộ hoàn toàn offline. Mô hình được phát hành theo giấy phép Apache 2.0, với trọng số đã huấn luyện sẵn có trên Hugging Face và Kaggle, đồng thời có thể được triển khai thông qua các nền tảng Google Cloud, bao gồm Model Garden, Cloud Run và GKE.