Açıklanabilirlik (Explainability)

Açıklanabilirlik nedir?

Açıklanabilirlik (explainability), bir yapay zeka modelinin verdiği kararın nedenini insanın anlayabileceği biçimde ortaya koyabilme yeteneği. Modern derin öğrenme modelleri milyarlarca parametreyle çalışan birer "kara kutu": girdiyi verirsin, çıktıyı alırsın ama arada ne olduğunu doğrudan göremezsin. Açıklanabilirlik araştırması bu kutuyu aralamaya çalışır.

Yakın kavram olan interpretability (yorumlanabilirlik) ile sık karıştırılır: yorumlanabilirlik modelin iç mekanizmasını anlamayı, açıklanabilirlik ise belirli bir kararın gerekçesini sunabilmeyi hedefler. Pratikte ikisi iç içe geçer.

Nasıl çalışır?

İki ana yaklaşım var. Birincisi, doğası gereği şeffaf modeller kullanmak: karar ağaçları ve lineer modeller gibi yapılar kararın izini sürmeye izin verir. İkincisi, karmaşık modelleri sonradan açıklamak (post-hoc): SHAP ve LIME gibi yöntemler her özelliğin karara katkısını hesaplar; attention haritaları modelin girdinin neresine "baktığını" gösterir; mekanistik yorumlanabilirlik ise ağın içindeki devreleri tek tek çözmeye çalışır.

Hiçbiri sihirli değnek değil — bir açıklama yönteminin kendisi de yanıltıcı olabilir. Bu yüzden alan, üretilen açıklamaların doğruluğunu ölçmeye giderek daha çok kafa yoruyor.

Neden önemli?

Kredi başvurusu reddedilen biri nedenini bilmek ister; doktor, teşhis öneren modelin neye dayandığını görmeden karara güvenemez. Yüksek riskli alanlardaki regülasyonlar da otomatik kararlar için açıklama zorunluluğu getirmeye başladı.

Açıklanabilirlik aynı zamanda geliştiricinin de aracı: modelin yanlış öğrendiği kalıpları — örneğin teşhis için hastalığın kendisi yerine görüntüdeki cetveli ipucu olarak kullanmasını — ancak içine bakarak yakalayabilirsin. Bias tespiti, güvenlik denetimi ve model hata ayıklama, hepsi açıklanabilirlikten beslenir.

Kullanım alanları

Finans: kredi skoru ve risk kararlarının gerekçelendirilmesi
Sağlık: teşhis destek sistemlerinde doktora kanıt sunma
Hukuk ve kamu: otomatik kararların denetlenebilirliği
Model geliştirme: hata ayıklama ve veri sızıntısı tespiti
AI güvenliği: modelin iç temsillerini ve davranışını denetleme

Açıklanabilirlik (Explainability)

Açıklanabilirlik nedir?

Nasıl çalışır?

Neden önemli?

Kullanım alanları

Ilgili terimler