AI Önyargısı (Bias)
Araç kavramlarıAI Önyargısı nedir?
AI bias, bir modelin belirli gruplar, durumlar veya konular hakkında sistematik ve tutarsız biçimde hatalı çıktılar üretmesidir. Modelin "kötü niyetli" olması değil, eğitim verilerindeki mevcut dengesizlikleri veya toplumsal önyargıları yansıtması söz konusudur.
Nasıl oluşur?
Veri önyargısı: Eğitim verisi belirli grupları az temsil ederse model bu gruplar için daha kötü performans gösterir. Yüz tanıma modelleri uzun süre koyu tenli bireyler için daha yüksek hata oranlarına sahipti — çünkü eğitim verisinde bu grup az temsil edilmişti.
Ölçüm önyargısı: Modelin başarısını ölçmek için kullanılan metrikler belirli bir grubu kayırmışsa model o metriği optimize ederek diğer grupları görmezden gelir.
Onay önyargısı (Confirmation bias): Model, mevcut önyargıları pekiştiren cevaplar üretmeye yönelebilir.
Tarihsel önyargı: Tarihsel verilerdeki ayrımcılığı (örn. belirli ırklara daha az kredi verilmesi) model öğrenirse bu kalıpları sürdürür.
Neden önemli?
AI sistemleri işe alım, kredi değerlendirme, tıbbi teşhis ve yargı gibi kritik alanlarda kullanılıyor. Bu sistemlerde bias;
- Belirli gruplara karşı ayrımcılık yaratabilir
- Mevcut eşitsizlikleri derinleştirebilir
- Yasal ve etik sorumluluklar doğurabilir
Bias'ı azaltma yolları
- Eğitim verisini çeşitlendirme ve dengeleme
- Farklı demografiler için ayrı ayrı model değerlendirmesi
- Constitutional AI ve RLHF gibi hizalama teknikleri
- Sürekli izleme ve güncelleme
- Çeşitli geliştirici ekipleri