Denetimsiz Öğrenme (Unsupervised Learning)
Araç kavramlarıDenetimsiz Öğrenme nedir?
Denetimsiz öğrenme, bir modele etiketsiz veri verip "şu veride ne gibi bir yapı var, sen bul" demektir. Denetimli öğrenmede her örneğin bir doğru cevabı (etiket) vardır; burada yoktur. Model, verinin içindeki gizli düzeni, benzerlikleri ve grupları kendi başına ortaya çıkarır.
Nasıl çalışır?
Mantık şu: elinde binlerce müşteri kaydı var ama hiçbiri "bu sadık müşteri", "bu kaçacak" diye etiketli değil. Denetimsiz öğrenme algoritmaları bu kayıtları benzerliklerine göre kümelere ayırır (clustering), ya da veriyi daha az boyuta indirip özünü çıkarır (dimensionality reduction). En bilinen yöntemler k-means kümeleme, hierarchical clustering ve PCA'dır.
Modern yapay zekada en kritik kullanım pretraining aşamasıdır. Büyük dil modelleri, internetteki devasa metni self-supervised •etiket modelin kendi içinden üretilir• biçimde okuyarak "bir sonraki token'ı tahmin et" görevinde eğitilir. Burada insan eliyle etiket girilmez; etiket verinin kendisinden doğar. Bu yüzden denetimsiz öğrenme, bugünkü LLM devriminin sessiz motorudur.
Neden önemli?
Çünkü etiketli veri pahalı ve kıttır. Dünyadaki verinin büyük çoğunluğu etiketsizdir. Denetimsiz öğrenme, bu etiketsiz okyanustan değer çıkarmanın tek pratik yolu. Bir modelin önce dünyayı genel olarak "anlaması", sonra küçük etiketli veriyle ince ayara gelmesi bu yaklaşım sayesinde mümkün oluyor.
Kullanım alanları
Müşteri segmentasyonu, anomali tespiti (dolandırıcılık, ağ saldırısı), öneri sistemleri, embedding üretimi, görüntü ve metin sıkıştırma, ve en önemlisi büyük modellerin pretraining aşaması. Anomali tespitinde özellikle güçlü: "normal" neye benzediğini öğrenir, sapan her şeyi işaretler.