Öznitelik Mühendisliği (Feature Engineering)
Veri & eğitimÖznitelik Mühendisliği nedir?
Feature engineering, elindeki ham veriyi bir makine öğrenmesi modelinin daha iyi anlayacağı sinyallere çevirme sürecidir. Model ne kadar güçlü olursa olsun, ona verdiğin girdiler zayıfsa sonuç da zayıf çıkar. Bu yüzden klasik ML''de çoğu zaman en büyük başarı sıçraması yeni bir algoritmadan değil, daha iyi öznitelikler üretmekten gelir.
Nasıl çalışır?
Birkaç tipik adımı vardır:
- Dönüştürme: Tarih bilgisinden "haftanın günü" veya "tatil mi" gibi yeni alanlar çıkarmak.
- Birleştirme: Birden çok kolonu tek anlamlı orana çevirmek (örneğin fiyat/metrekare).
- Kodlama: Kategorik veriyi (şehir, renk) modelin işleyebileceği sayısal forma çevirmek.
- Ölçekleme: Farklı aralıklardaki değerleri ortak bir ölçeğe getirmek.
- Temizleme: Eksik değerleri doldurmak, aykırı değerleri ele almak.
Amaç, verideki gerçek örüntüyü modele net biçimde sunmaktır. İyi bir öznitelik, modelin işini kolaylaştırır; gereksiz veya gürültülü öznitelik ise overfitting riskini artırır.
Neden önemli?
Deep learning modelleri özniteliklerin bir kısmını kendi öğrenebilir, ama tablo verisi (tablolar, satış kayıtları, finans verisi) söz konusu olduğunda feature engineering hâlâ belirleyicidir. Aynı veri setinde iki ekipten birini öne geçiren şey genellikle model seçimi değil, öznitelik kalitesidir. "Garbage in, garbage out" sözü tam da burayı anlatır.
Kullanım alanları
- Finans: kredi skorlama, dolandırıcılık tespiti
- Perakende: talep tahmini, müşteri segmentasyonu
- Sağlık: risk tahmin modelleri
- Herhangi bir supervised learning projesinde veri hazırlık aşaması
Ilgili terimler
