Yarı Denetimli Öğrenme (Semi-Supervised Learning)
Araç kavramlarıYarı Denetimli Öğrenme nedir?
Yarı denetimli öğrenme (semi-supervised learning), az miktarda etiketli veri ile çok daha büyük bir etiketsiz veri yığınını aynı anda kullanan bir yaklaşımdır. Denetimli öğrenme her örneğin etiketli olmasını ister, denetimsiz öğrenme ise hiç etiket kullanmaz. Yarı denetimli öğrenme tam ortada durur: "elimde biraz etiket var, gerisini modelin kendisi tamamlasın" der.
Nasıl çalışır?
Tipik senaryoda önce küçük etiketli kümeyle bir model eğitilir. Sonra bu model, etiketsiz örnekler için tahmin üretir. Modelin en emin olduğu tahminler "sözde etiket" (pseudo-label) olarak kabul edilir ve eğitim kümesine eklenir. Model bu genişlemiş veriyle tekrar eğitilir. Bu döngü, etiketsiz veride gizli olan yapıyı modele öğretir.
Ardındaki temel varsayım şudur: birbirine benzeyen örnekler muhtemelen aynı sınıfa aittir. Etiketsiz veri, verinin genel şeklini modele göstererek karar sınırlarını daha isabetli çizmesine yardım eder.
Neden önemli?
Gerçek hayatta veri etiketlemek pahalı ve yavaştır — bir doktorun binlerce röntgeni tek tek işaretlemesi gerekir. Ama etiketsiz veri genellikle boldur ve ucuzdur. Yarı denetimli öğrenme bu dengesizliği fırsata çevirir: az etiketle, çok veriden faydalanır. Modern self-supervised learning yaklaşımlarının da fikri buradan beslenir.
Kullanım alanları
Tıbbi görüntü analizi, konuşma tanıma, web sayfası sınıflandırma ve dolandırıcılık tespiti gibi etiketli verinin kıt, etiketsiz verinin bol olduğu her alan. Büyük dil modellerinin eğitim mantığında da benzer bir ruh vardır: bol miktarda ham metinden öğrenip, az miktarda etiketli veriyle yönlendirmek.
Ilgili terimler
