F1 Skoru (F1 Score)
Araç kavramlarıF1 Skoru nedir?
F1 skoru, bir sınıflandırma modelinin ne kadar iyi çalıştığını ölçen tek bir sayıdır. İki ayrı metriği, precision (kesinlik) ve recall (duyarlılık) değerlerini birleştirir. Tek başına "doğruluk oranı" (accuracy) bazen yanıltıcı olur; F1 skoru bu tuzağı kapatmak için vardır.
Diyelim ki 1000 mailden sadece 10 tanesi spam. Modelin hepsine "spam değil" derse %99 doğruluk yakalar ama tek bir spam'i bile yakalamamıştır. İşte F1 skoru tam da bu durumda gerçeği söyler.
Nasıl çalışır?
İki kavramı bilmek gerekir:
- Precision: Model "pozitif" dediği şeylerin ne kadarı gerçekten pozitif? Yani yakaladıklarının doğruluğu.
- Recall: Gerçekten pozitif olanların ne kadarını model yakaladı? Yani kaçırmama oranı.
F1 skoru bu ikisinin harmonik ortalamasıdır: F1 = 2 × (precision × recall) / (precision + recall). Harmonik ortalama, iki değerden biri düşükse sonucu da aşağı çeker. Yani hem precision hem recall yüksekse F1 yüksek çıkar; biri çökerse F1 de çöker. Değer 0 ile 1 arasındadır, 1 mükemmele yakındır.
Neden önemli?
Çünkü dengesiz veri her yerdedir: dolandırıcılık tespiti, hastalık teşhisi, spam filtreleme. Bu senaryolarda accuracy tek başına aldatıcıdır. F1 skoru, modelin hem yanlış alarm vermemesini hem de gerçek vakaları kaçırmamasını aynı anda zorlar. Bir benchmark karşılaştırmasında modelleri adil kıyaslamanın yolu çoğu zaman F1 üzerinden geçer.
Kullanım alanları
- Tıbbi teşhis modellerinin değerlendirilmesi
- Spam ve dolandırıcılık tespiti
- Bilgi çıkarımı, varlık tanıma (NER) gibi NLP görevleri
- Arama ve öneri sistemlerinin kalite ölçümü
Precision mı recall mı daha önemli sorusuna bağlı olarak F1''in ağırlıklı versiyonları (F-beta) da kullanılır.
Ilgili terimler
