Açık Kaynak mı, Kapalı AI mı? Ne Zaman Hangisini Seçmelisin

Açık kaynak ve kapalı AI modelleri arasında nasıl karar verirsin? Maliyet, gizlilik, performans ve özelleştirme açısından karşılaştırmalı rehber.
Açık Kaynak mı, Kapalı AI mı?
Bir AI modeli kullanmaya karar verdin — ama hangi tarafta durman gerektiğini bilmiyorsun. OpenAI, Anthropic, Google: API'yi çağırıyorsun, model çalışıyor. Llama, Mistral, Qwen: modeli indiriyorsun, kendi sunucunda çalıştırıyorsun. İkisi arasındaki fark sadece teknik değil — maliyet, gizlilik, özelleştirme ve bağımlılık meselesi. Bu rehber hangisinin senin için doğru olduğuna karar vermeni sağlayacak.
Temel Fark Nedir?
Kapalı modeller (OpenAI, Anthropic, Google): Model ağırlıkları yayınlanmaz. API üzerinden erişirsin, verilerini dışarıya gönderirsin, fiyatı sağlayıcı belirler. Kurulum sıfır, ama kontrol de sıfır.
Açık kaynak modeller (Llama, Mistral, Qwen, DeepSeek): Model ağırlıkları kamuya açık. İstersen Hugging Face'ten indirir kendi sunucunda çalıştırırsın, istersen Spaces'ta ücretsiz denersin. Kontrol sende, sorumluluk da sende.
2026'da bu iki dünya arasındaki performans farkı 6 aya indi. Kapalı modeller çıktıktan altı ay sonra açık kaynak alternatifi neredeyse aynı kaliteye ulaşıyor. Günlük görevlerin büyük çoğunluğunda — yazı, özetleme, kod, soru-cevap — fark artık pratikte hissedilmiyor.
[mindi_yorum]
💰 Kapalı modeller ortalama açık kaynaktan 6 kat pahalı; yüksek hacimde self-host ile %60–80 tasarruf mümkün
🟢 Performans farkı kapandı — kalan fark en zor reasoningiçok adımlı mantık yürütme gerektiren görevler görevlerinde, günlük kullanımda değil
🟡 Açık kaynak "ücretsiz" değil — altyapı, bakım ve teknik ekip maliyeti var
🔵 İkisini birden kullanmak artık norm: kritik işler kapalı, ölçekli işler açık kaynak
Performans: Gerçekten Fark Var mı?
Kısa cevap: var, ama düşündüğünden az.
SWE-bench gibi zorlu yazılım geliştirme testlerinde kapalı modeller hâlâ öne — Claude ve GPT serisi en üstte. Ama bu fark her geçen ay daralıyor. DeepSeek ve Qwen gibi açık kaynak modeller, piyasaya çıkan kapalı modellerin 4–6 ay gerisinde kalıyor, ama ardından yakalıyor.
Pratik anlamda şöyle düşün:
- Kod tamamlama, e-posta yazma, özetleme: Açık kaynak yeterli
- Karmaşık çok adımlı akıl yürütme, hukuki analiz, tıbbi karar desteği: Kapalı modeller hâlâ avantajlı
- İnce ayarlı özel görevler: Fine-tune edilmiş açık kaynak model kapalıyı geçebilir
Maliyet: Rakamlar Neyi Söylüyor?
Maliyet farkı ciddi. Llama 4 70B modeli için kendi altyapında yaklaşık 0,15 dolar / milyon token ödersin. Benzer büyüklükte kapalı bir model API'siyle bu rakam 10 kata kadar çıkabiliyor.
Ama hesabı sadece token üzerinden yapmak yanıltıcı. Açık kaynak kullanıyorsan:
- GPU kiralama veya satın alma maliyeti
- Model yönetimi, güncelleme, bakım
- DevOps/MLOps ekibi veya zamanı
Düşük hacimde (ayda birkaç bin sorgu) kapalı model API çoğunlukla daha ucuza gelir. Yüksek hacimde (günde milyonlarca sorgu) self-host açıkça kazanır.
Gizlilik ve Güvenlik: Kimin Verisi?
Kapalı bir modele veri gönderdiğinde teknik olarak üçüncü taraf sunucularına veri göndermiş olursun. Sağlık, hukuk, finans gibi düzenlenmiş sektörlerde bu durum yasal yaptırım riski taşıyabilir. Ticari sır içeren verileri kapalı model API'sine göndermek ciddi bir güvenlik açığı.
Açık kaynak modeli kendi altyapında çalıştırıyorsan veri dışarı çıkmaz. Bu tek başına bazı sektörler için tercih değil, zorunluluk.
Kapalı model sağlayıcılarının çoğunun kurumsal planlarında "verilerinizi eğitimde kullanmıyoruz" garantisi var — ama bu garanti sözleşme şartlarına ve platforma göre değişiyor. Okumadan imzalama.
Özelleştirme: Modeli Senin Gibi Konuşturabilir misin?
Kapalı modeli fine-tunei
modeli kendi verinle yeniden eğiterek belirli bir göreve özelleştirme etme imkanı kısıtlı — bazı sağlayıcılar sunuyor ama kontrol yine sağlayıcıda.
Açık kaynak modelde tam kontrolün var:
- Şirketinin jargonunu, hukuki terminolojini, ürün bilgilerini öğretebilirsin
- Belirli bir görev için küçük ama isabetli bir model elde edebilirsin
- LoRAi
modelin tamamını değil, küçük adaptör katmanlarını eğiterek fine-tune yapma yöntemi; düşük GPU gerektirir ile düşük maliyetle ince ayar yapabilirsin
Kendi verinle fine-tune edilmiş 7B açık kaynak model, genel amaçlı 70B kapalı modeli belirli görevlerde geçebiliyor.
Açık Kaynağı Yerel Çalıştırmak: Donanım Gereksinimleri
Açık kaynak modeli kendi bilgisayarında veya sunucunda çalıştırmanın en popüler iki aracı Ollama ve LM Studio. Ollama terminal tabanlı, LM Studio ise masaüstü uygulaması olarak çalışıyor — ikisi de aynı modelleri kullanıyor ama hedef kitle biraz farklı.
Ama her ikisinde de asıl belirleyici olan donanımın. Modeli hangi cihazda çalıştıracağın hem hızı hem de hangi modeli seçebileceğini doğrudan etkiliyor.
RAM ve VRAM: Temel Kriter
Model tamamen GPU belleğine (VRAMi
ekran kartının kendi RAM'i; CPU RAM'inden çok daha hızlı, model çıkarımı için kritik) sığarsa GPU'da çalışır — hızlı. Sığmazsa kısmen veya tamamen CPU RAM'ine taşınır — yavaş ama çalışır.
Kuantizasyoni
modelin ağırlıklarını daha az bit'le temsil ederek boyutunu küçültme; q4 = 4-bit, q8 = 8-bit — kalite biraz düşer, hız ve boyut kazanılır seviyesi de boyutu etkiler. q4_K_M en yaygın tercih — kalite kaybı minimal, boyut küçük.
Model boyutuna göre gereksinimler (q4_K_M kuantizasyonunda):
| Model Boyutu | Minimum RAM/VRAM | Önerilen | Örnek Modeller |
|---|---|---|---|
| 3B | 4 GB | 8 GB | Phi-3-mini, Llama-3.2-3B |
| 7B | 6 GB | 8–12 GB | Mistral-7B, Llama-3.1-8B |
| 13B | 8 GB | 16 GB | Llama-2-13B |
| 32B | 20 GB | 24 GB | Qwen2.5-32B |
| 70B | 40 GB | 48 GB | Llama-3.3-70B |
Platforma Göre Durum
Apple Silicon (M1/M2/M3/M4):
En avantajlı platform. Unified memoryi
CPU ve GPU'nun aynı RAM'i paylaşması; Apple Silicon'ın en büyük avantajı mimarisi sayesinde 16 GB RAM'li bir MacBook, 16 GB VRAM'li bir ekran kartı gibi davranıyor. M2/M3 Pro ile 7B–13B modeller akıcı çalışıyor, M3 Max (48 GB) ile 70B bile mümkün.
NVIDIA GPU:
RTX 3060 (12 GB VRAM) → 7B rahat, 13B sıkışık
RTX 4070 (12 GB VRAM) → 7B rahat, 13B zor
RTX 4090 (24 GB VRAM) → 32B rahat, saniyede 40–80 token
RTX 3090 / 4090 en yaygın ev kullanımı tercihi.
AMD GPU:
Ollama AMD desteği var ama NVIDIA kadar optimize değil. RX 7900 XTX (24 GB VRAM) ile çalışıyor, performans NVIDIA'nın biraz gerisinde kalıyor.
Sadece CPU (GPU yok):
Çalışır ama yavaş. Modern 8 çekirdekli işlemcide 7B model saniyede 5–15 token üretiyor — konuşma hızının altında. Acil ihtiyaç veya test için tamam, günlük kullanım için sabır gerektirir. En az 16 GB sistem RAM'i şart.
Hız Beklentisi
Token/saniyei
modelin saniyede ürettiği kelime/parça sayısı; 20+ akıcı hissettiriyor, 50+ hızlı değerleri:
| Donanım | 7B Model Hızı |
|---|---|
| CPU (8 çekirdek, 32 GB RAM) | 5–15 tok/sn |
| RTX 3060 (12 GB) | 25–40 tok/sn |
| RTX 4090 (24 GB) | 60–90 tok/sn |
| M2 Pro (16 GB) | 35–55 tok/sn |
| M3 Max (48 GB) | 70–100 tok/sn |
20 token/saniyenin altı gerçek zamanlı sohbet için yavaş hissettiriyor. Arka planda toplu işlem yapıyorsan hız daha az önemli.
Ollama mı, LM Studio mı?
Ollama terminal araçlarına aşinaysan iyi seçim. ollama run mistral komutuyla model indirilip çalışıyor. API sunuyor, başka uygulamalar bağlanabiliyor. Hafif, arka planda servis olarak çalışıyor.
LM Studio görsel arayüz isteyenler için. Model indirme, VRAM kullanımını takip etme, sohbet arayüzü — hepsi grafiksel. Donanım uyumluluğunu da otomatik kontrol ediyor: sisteminle uyumlu modelleri öne çıkarıyor.
İkisi de Hugging Face'ten indirilen GGUF formatındaki modelleri çalıştırıyor — model kütüphanesi aynı.
Karar Rehberi: Hangi Durumda Ne Seçersin?
Kapalı model seç eğer:
- Hızlı prototip yapıyorsan ve kuruluma zaman harcamak istemiyorsan
- Hacmin düşükse ve API maliyeti kabul edilebilirse
- En son model performansı kritikse (keskin reasoning görevleri)
- Teknik ekibin yoksa ve altyapı yönetmek istemiyorsan
Açık kaynak seç eğer:
- Veri gizliliği zorunluysa (sağlık, hukuk, finans)
- Yüksek hacimde çalışıyorsan ve maliyet önemliyse
- Modeli kendi verilerinle özelleştirmek istiyorsan
- Belirli bir sağlayıcıya bağımlı olmak istemiyorsan
- İnternete bağlı olmayan bir ortamda (air-gappedi
internetten tamamen izole edilmiş sistem) çalışmak zorundaysan
İkisini birden kullan eğer:
- Kritik ve karmaşık görevler için kapalı, yüksek hacimli rutin görevler için açık kaynak
- Prototipte kapalı API, prodüksiyonda fine-tune edilmiş açık kaynak
[mindi_yorum]
💰 "Açık kaynak bedava" yanılgısına düşme — altyapı ve bakım maliyeti var, düşük hacimde API daha ucuz olabilir
🟢 Hibrit yaklaşım 2026'da artık norm — kritik işler kapalı, ölçekli rutin işler açık kaynak
🟡 Kapalı model sözleşme şartlarını oku — "verilerinizi kullanmıyoruz" garantisi platforma göre değişiyor
🔵 Başlangıç için kapalı API ile prototip yap, ölçeklenince açık kaynağa geçişi değerlendir
Sonuç
Doğru soru "hangisi daha iyi?" değil — "benim durumum için hangisi mantıklı?" olmalı.
- Verin ne kadar hassas? → Gizlilik gerektiriyorsa açık kaynak zorunluluk
- Hacmin ne kadar? → Düşükse API, yüksekse self-host
- Teknik kapasiteniz var mı? → Yoksa kapalı API başlangıç için daha az riskli
- Özelleştirme gerekiyor mu? → Fine-tune istiyorsan açık kaynak
- En güncel performans şart mı? → Şimdilik kapalı modeller öne, ama bu fark kapanıyor
Denemeye başlamak için Hugging Face en kolay kapı — ücretsiz hesapla açık kaynak modelleri tarayıcıdan test edebilir, sonra kararını verebilirsin.