Hata Matrisi (Confusion Matrix)
Araç kavramlarıHata Matrisi nedir?
Hata matrisi (confusion matrix), bir sınıflandırma modelinin nerede doğru, nerede yanlış yaptığını gösteren tablodur. Bir eksende modelin tahmini, diğer eksende gerçek (ground truth) durur. İkili sınıflandırmada 2x2'lik bir kareye dört kutu sığar: doğru pozitif, yanlış pozitif, doğru negatif, yanlış negatif. Modele "kaç tane bildin" değil, "nasıl yanıldın" sorusunu sordurur.
Nasıl çalışır?
Diyelim model "spam mı değil mi" diye karar veriyor. Dört ihtimal var:
True Positive (TP): Spam'i spam dedi — doğru. False Positive (FP): Normal maile spam dedi — yanlış alarm. False Negative (FN): Spam'i kaçırdı, normal sandı — atlanan tehdit. True Negative (TN): Normali normal dedi — doğru.
Bu dört sayıyı tabloya yerleştirince modelin hangi tür hatayı daha çok yaptığı ortaya çıkar. Çok sınıflı problemde tablo NxN olur ve hangi sınıfın hangisiyle karıştırıldığını tek bakışta görürsün.
Neden önemli?
Tek başına accuracy (doğruluk oranı) yalan söyleyebilir. 100 mailin 95'i normalse, "hepsi normal" diyen tembel model %95 doğru görünür ama tek spam'i bile yakalamaz. Hata matrisi bu tuzağı açığa çıkarır; FP ile FN'i ayrı ayrı gösterir. Precision, recall ve F1 gibi metrikler de doğrudan bu tablodan hesaplanır. Modelin gerçekte işe yarayıp yaramadığını anlamak istiyorsan başlangıç noktan burası.
Kullanım alanları
Sınıflandırma modeli değerlendirmesi — hangi hata daha pahalı? Tıbbi teşhis ve dolandırıcılık tespiti gibi FN ile FP maliyetinin çok farklı olduğu yerler. Eşik (threshold) ayarı — kararı sıkı mı gevşek mi tutacağını seçmek. Precision, recall ve F1 skorunun hesaplandığı temel.
Ilgili terimler
