Atoms ile kod yazmadan uygulama kur — AI ekibin senin için planlasın, kodlasın, deploy etsindene →

Gerçek Referans (Ground Truth)

Veri & eğitim
Ing: Ground TruthGuncellendi: 12 Haziran 2026
Bir modelin tahminlerinin kıyaslandığı doğru kabul edilen referans veri. Model ne kadar iyi sorusunun cevabı, ground truth ne kadar iyiyse o kadar anlamlı.

Ground truth nedir?

Ground truth, bir yapay zeka modelinin tahminlerini değerlendirirken "doğru cevap" kabul edilen referans veridir. Bir görüntüdeki nesnenin gerçekten kedi olduğu bilgisi, bir e-postanın gerçekten spam olduğu etiketi, bir hastanın gerçekten o teşhisi aldığı kayıt — bunların hepsi ground truth. Terim havacılıktan geliyor: uçaktan bakınca gördüğünü, yerde fiilen olanla kıyaslarsın. Makine öğrenmesinde de aynı mantık — modelin "yukarıdan" yaptığı tahmin, sahadaki gerçekle karşılaştırılır.

Nasıl çalışır?

Denetimli öğrenmede her eğitim örneği bir ground truth etiketiyle eşleşir. Model tahmin yapar, tahmin etiketle kıyaslanır, aradaki fark (loss) hesaplanır ve model bu farkı azaltacak şekilde güncellenir. Değerlendirme aşamasında da aynı referans kullanılır: doğruluk, kesinlik, duyarlılık gibi tüm metrikler tahminlerin ground truth ile örtüşme oranından türetilir.

Ground truth genelde insan emeğiyle üretilir: uzman etiketçiler veriyi tek tek işaretler. Tıbbi görüntüleme gibi alanlarda birden fazla uzmanın bağımsız etiketleyip uzlaşması istenir, çünkü uzmanlar bile her zaman aynı fikirde olmaz. Bu da işin kritik gerçeğini gösteriyor: ground truth mutlak gerçek değil, üzerinde anlaşılmış en iyi referanstır.

Neden önemli?

Bir modelin kalitesi, kıyaslandığı referansın kalitesini aşamaz. Etiketler hatalıysa model hatayı öğrenir; etiketler önyargılıysa model önyargıyı kopyalar ve değerlendirme sonuçları gerçeği yansıtmaz. "Çöp girerse çöp çıkar" kuralının en net göründüğü yer burası. Büyük dil modellerinin değerlendirilmesinde işler daha da çetrefilli: açık uçlu bir sorunun tek doğru cevabı yok, bu yüzden insan tercihleri veya hakem modeller referans olarak kullanılıyor — bu da ground truth kavramının sınırlarını zorlayan güncel bir tartışma alanı.

Kullanım alanları

Otonom araçlar için yol görüntülerinin kare kare etiketlenmesi, tıbbi görüntülerde tümör sınırlarının uzmanlarca çizilmesi, ses kayıtlarının transkript edilmesi ve benchmark veri setlerinin hazırlanması ground truth üretiminin tipik örnekleri. Veri etiketleme bugün başlı başına bir sektör; etiket kalitesini denetlemek de veri ekiplerinin sürekli iş kalemlerinden biri.

mindi
mindi'nin notu
Modelin notunu açıklarken kimse cevap anahtarını sorgulamıyor. Oysa kötü etiketle ölçülen yüzde 95 doğruluk, iyi etiketle ölçülen yüzde 85'ten daha az şey söyler. Önce cevap anahtarına bak.