⚡ Öne ÇıkanHermes agent kurulum rehberi
ChatMultimodal

Llama 4 Scout

Meta

Resmi site →

💻 Bu model yerel bilgisayarında çalıştırılabilir — internet bağlantısı veya API ücreti gerekmez.

Minimum 24GB VRAM (1.78-bit Unsloth quant ile). Q4_K_M için ~55GB gerekir, bu da 64GB+ Apple Silicon veya dual GPU ister. 24GB GPU'da düşük quantization ile ~20 token/sn alınır.

Ollama ile çalıştır — ücretsiz, açık kaynak yerel model yöneticisi.

ollama run llama4:scoutkomutuyla terminalden çalıştır

LM Studio ile aç — görsel arayüzlü yerel model yöneticisi (Windows, Mac, Linux).

💻 LM Studio'da Nasıl Kullanılır?

Meta'nın 10 milyon token bağlam penceresine sahip açık kaynak modeli. Tek bir seferde tüm bir kod tabanını veya yüzlerce sayfalık belgeyi okuyabiliyor. LM Studio ve Ollama üzerinden yerel olarak çalıştırılabilir.

Bağlam uzunluğu

10000M token

API giriş (1M token)

$0.15

API çıkış (1M token)

$0.6

Kullanıcı planı

Sadece API

Ücretsiz plan mevcut

Türkçe destek

Orta

Çok modlu

Evet

Hızı

Hızlı

Bilgi kesim tarihi

Ağustos 2024

OpenAI uyumlu

Evet

Ne İçin Kullanılır?

  • Çok uzun belge ve kod tabanı analizi
  • Yerel (local) kurulum ile gizlilik odaklı projeler
  • Çok dosyalı repo inceleme
  • Fine-tuning projeleri

Güçlü Yönler

  • 10M token — piyasanın en geniş bağlam penceresi
  • Açık kaynak, LM Studio/Ollama ile yerel çalışır
  • API maliyeti çok düşük
  • Multimodal (görsel anlama)

Dikkat Edilecekler

  • Türkçe desteği orta seviye
  • Çıktı token limiti düşük (16K)
  • Yerel çalıştırmak güçlü GPU gerektiriyor

En Yakın Alternatif

GLM-4

Zhipu AI · Chat

Bağlam: 128KAPI: $0.14 / $0.14 /1MTürkçe: Zayıf

GPT-4o mini

OpenAI · Chat

Bağlam: 128KAPI: $0.15 / $0.6 /1MTürkçe: İyi
← Tüm modellere dön