ROC-AUC (ROC Eğrisi ve Altındaki Alan)
Araç kavramlarıROC-AUC nedir?
ROC-AUC, ikili sınıflandırma yapan bir modelin başarısını ölçen metriktir. Açılımı "Receiver Operating Characteristic — Area Under Curve". Model her örnek için bir olasılık skoru üretir; ROC eğrisi, farklı eşik değerlerinde modelin doğru pozitif oranı (True Positive Rate) ile yanlış pozitif oranını (False Positive Rate) karşılaştırır. AUC ise bu eğrinin altında kalan alandır: 1.0 kusursuz ayrım, 0.5 ise yazı-tura kadar rastgele demektir.
Nasıl çalışır?
Modeli tek bir eşiğe (örneğin 0.5) sabitlemek yerine, tüm olası eşikleri gezersin. Her eşikte kaç gerçek pozitifi yakaladığını ve kaç yanlış alarm ürettiğini işaretlersin; bu noktalar birleşince ROC eğrisi çıkar. AUC bu eğriyi tek sayıya indirir. Sezgisel yorumu şudur: rastgele bir pozitif örnek ile rastgele bir negatif örnek seçtiğinde, modelin pozitife daha yüksek skor verme olasılığıdır.
Neden önemli?
Accuracy (doğruluk) tek başına yanıltıcıdır. Veri dengesizse — 100 örnekten 95'i negatifse — her şeye "negatif" diyen model %95 doğruluk alır ama işe yaramaz. ROC-AUC eşikten bağımsız çalıştığı için modelin gerçek ayırt etme gücünü gösterir. Dengesiz veri kümelerinde ve modelleri kıyaslarken bu yüzden tercih edilir. Not: aşırı dengesiz durumlarda precision-recall eğrisi daha bilgilendirici olabilir.
Kullanım alanları
Tıbbi teşhis modelleri (hasta/sağlıklı), dolandırıcılık tespiti, spam filtreleri, kredi riski skorlaması ve genel olarak iki sınıf arasında karar veren her modelin değerlendirmesi. Model seçim ve hiperparametre ayarında karşılaştırma ölçütü olarak yaygın kullanılır.
Ilgili terimler
