AI Önyargısı (Bias)

AI Önyargısı nedir?

AI bias, bir modelin belirli gruplar, durumlar veya konular hakkında sistematik ve tutarsız biçimde hatalı çıktılar üretmesidir. Modelin "kötü niyetli" olması değil, eğitim verilerindeki mevcut dengesizlikleri veya toplumsal önyargıları yansıtması söz konusudur.

Nasıl oluşur?

Veri önyargısı: Eğitim verisi belirli grupları az temsil ederse model bu gruplar için daha kötü performans gösterir. Yüz tanıma modelleri uzun süre koyu tenli bireyler için daha yüksek hata oranlarına sahipti — çünkü eğitim verisinde bu grup az temsil edilmişti.

Ölçüm önyargısı: Modelin başarısını ölçmek için kullanılan metrikler belirli bir grubu kayırmışsa model o metriği optimize ederek diğer grupları görmezden gelir.

Onay önyargısı (Confirmation bias): Model, mevcut önyargıları pekiştiren cevaplar üretmeye yönelebilir.

Tarihsel önyargı: Tarihsel verilerdeki ayrımcılığı (örn. belirli ırklara daha az kredi verilmesi) model öğrenirse bu kalıpları sürdürür.

Neden önemli?

AI sistemleri işe alım, kredi değerlendirme, tıbbi teşhis ve yargı gibi kritik alanlarda kullanılıyor. Bu sistemlerde bias;

Belirli gruplara karşı ayrımcılık yaratabilir
Mevcut eşitsizlikleri derinleştirebilir
Yasal ve etik sorumluluklar doğurabilir

Bias'ı azaltma yolları

Eğitim verisini çeşitlendirme ve dengeleme
Farklı demografiler için ayrı ayrı model değerlendirmesi
Constitutional AI ve RLHF gibi hizalama teknikleri
Sürekli izleme ve güncelleme
Çeşitli geliştirici ekipleri

AI Önyargısı (Bias)

AI Önyargısı nedir?

Nasıl oluşur?

Neden önemli?

Bias'ı azaltma yolları

Ilgili terimler