Ana Sayfa/Haberler/Google Gemma 4 12B: Açık Kaynak Çok Modl
yapay-zeka-modelleri

Google Gemma 4 12B: Açık Kaynak Çok Modlu Model 16 GB RAM'de Çalışıyor

VentureBeat·4 Haziran 2026·🔗 Kaynağa Git
Google Gemma 4 12B: Açık Kaynak Çok Modlu Model 16 GB RAM'de Çalışıyor

Google, yalnızca 16 GB RAM ile standart dizüstü bilgisayarda çalışabilen açık kaynaklı çok modlu modeli Gemma 4 12B'yi yayınladı. Encoder kullanmayan yeni mimarisiyle ses ve görüntüyü doğrudan işleyebiliyor.

Google, yapay zeka açık kaynak modelleri arasında dikkat çeken yeni bir hamle yaptı. Şirket, yalnızca 16 GB VRAM veya birleşik bellek ile standart bir dizüstü bilgisayarda çalışabilen, 11.95 milyar parametreli Gemma 4 12B modelini Apache 2.0 lisansıyla yayınladı.

Modelin en büyük yeniliği, encoder kullanmayan "Unified" mimarisi. Geleneksel çok modlu sistemler ses ve görüntü verilerini ayrı encoder'larla işlerken, Gemma 4 12B bu verileri doğrudan ana LLM omurgasına aktarıyor. Görüntü encoder'ı yalnızca 35 milyon parametreli tek bir matris çarpımıyla değiştirilmiş, ses encoder'ı ise tamamen kaldırılmış. Bu sayede çok modlu görevlerde daha düşük gecikme süresi ve azaltılmış bellek kullanımı sağlanıyor.

Model 256K token bağlam penceresi, yerleşik adım adım akıl yürütme (thinking) modu ve otonom yazılım ajanları geliştirmek için gerekli olan function calling ve sistem prompt desteği sunuyor. Karşılaştırma testlerinde Google'ın daha büyük 26B Mixture-of-Experts modeline yakın performans gösteriyor.

Gemma 4 12B, Hugging Face ve Kaggle üzerinden hemen indirilebiliyor; vLLM, SGLang, MLX ve llama.cpp gibi popüler dağıtım çerçeveleriyle uyumlu. Ses girişi 30 saniye, video anlama ise 60 saniye ile sınırlı. Model özellikle sağlık, finans ve savunma gibi sıkı veri gizliliği gerektiren sektörler ile çok modlu otonom ajan iş akışları için ideal.

Benzer Haberler