Kayıp Fonksiyonu (Loss Function)

Modeller
Ing: Loss FunctionGuncellendi: 4 Haziran 2026
Modelin tahminleri ile gerçek değerler arasındaki farkı sayısal olarak ölçen matematiksel fonksiyon. Eğitim sürecinin yönünü belirler.

Kayıp Fonksiyonu nedir?

Kayıp fonksiyonu (loss function), bir makine öğrenmesi modelinin ne kadar "yanlış" yaptığını sayısal olarak ifade eden matematiksel bir araçtır. Model bir tahmin üretir, gerçek değerle karşılaştırılır ve bu fark bir sayıya dönüştürülür. Eğitim boyunca bu sayıyı minimize etmek hedeflenir.

Nasıl çalışır?

Eğitim döngüsü şöyle işler:

  1. Model bir giriş alır ve tahmin üretir
  2. Kayıp fonksiyonu, tahmini gerçek etiketle karşılaştırır
  3. Sonuç (loss değeri) backpropagation ile geriye iletilir
  4. Gradient descent optimizer, model ağırlıklarını günceller
  5. Döngü tekrarlanır; loss düştükçe model iyileşir

Yaygın kayıp fonksiyonları:

  • Cross-Entropy Loss: Sınıflandırma ve dil modellerinde standart seçim
  • MSE (Mean Squared Error): Regresyon görevlerinde yaygın
  • KL Divergence: İki olasılık dağılımını karşılaştırmak için; RLHF'de kullanılır
  • Contrastive Loss: Embedding modellerinin eğitiminde

LLM'lerde kayıp genellikle "bir sonraki tokeni ne kadar doğru tahmin ettiğim" üzerinden ölçülür — bu yüzden perplexity ile doğrudan ilişkilidir.

Neden önemli?

Hangi kayıp fonksiyonunun seçildiği, modelin neyi optimize ettiğini belirler. Yanlış seçim; modelin teknik olarak "düşük loss" almasına rağmen işe yaramayan çıktılar üretmesine yol açabilir. Fine-tuning'de ise kayıp fonksiyonu değişimi, modelin davranışını köklü biçimde değiştirebilir.

Kullanım alanları

  • Dil modeli pretraining: Next-token prediction loss
  • Fine-tuning: SFT'de cross-entropy, DPO'da karşılaştırmalı kayıp
  • Görüntü modelleri: Reconstruction loss, adversarial loss
  • Değerlendirme: Düşük loss iyi bir işaretçi ama downstream görevlerde doğrulanmalı
mindi
mindi'nin notu
Loss'u sadece "hata sayacı" sanmak yanıltıcı — ne kaybı minimize ettiğin, modelin gerçekte ne öğrendiğini belirliyor. Aynı mimari, farklı loss fonksiyonuyla bambaşka bir şey olabilir.