Karar Ağacı (Decision Tree)
ModellerKarar Ağacı nedir?
Karar ağacı, bir dizi "evet/hayır" sorusuyla veriyi dallara ayırıp sonunda bir tahmine ulaşan modeldir. En tepede bir soru sorar (kök), cevaba göre sağa ya da sola dallanır, her dalda yeni bir soru sorulur... en altta (yaprak) cevabı verir. İnsanın "şu olduysa bu, değilse şu" diye düşünmesine en yakın makine öğrenmesi modeli budur.
Nasıl çalışır?
Model eğitilirken her düğümde "veriyi en temiz şekilde ikiye bölen soru hangisi?" diye bakar. Temizlikten kasıt: bölünen grupların mümkün olduğunca tek tip olması. Bunu ölçmek için Gini veya entropi gibi ölçütler kullanılır. Ağaç, veriyi adım adım daha homojen parçalara ayırarak büyür; durduğunda her yaprak bir sınıfı ya da bir sayıyı temsil eder. Yeni bir örnek geldiğinde kökten başlar, sorulara verdiği cevaplara göre bir yaprağa düşer, o yaprağın değeri de tahmindir.
Neden önemli?
İki büyük artısı var: yorumlanabilir ve pratik. Modelin neden öyle karar verdiğini ağaca bakarak görebilirsin — kara kutu değil. Ayrıca sayısal ve kategorik veriyi olduğu gibi yer, fazla ön işlem istemez, küçük veride hızlı eğitilir. Tek başına kullanıldığında ezbere (overfitting) kaçabilir; bu yüzden random forest ve gradient boosting gibi yöntemler birçok ağacı birleştirip onu güçlendirir.
Kullanım alanları
Tablo verisiyle classification ve regression — kredi riski, churn tahmini. Random forest ve gradient boosted trees gibi ensemble modellerin yapı taşı. Kararın gerekçesini göstermen gereken yerler. Daha karmaşık modele geçmeden hızlı bir baseline kurmak.
Ilgili terimler
