Anayasal Yapay Zeka (Constitutional AI)

Constitutional AI nedir?

Constitutional AI (CAI), dil modellerini daha güvenli ve değerlerle uyumlu hale getirmek için Anthropic tarafından geliştirilen bir eğitim yaklaşımıdır. Temel fikir şu: modele bir "anayasa" — yani yazılı ilkeler listesi — verilir ve model bu ilkelere göre kendi çıktılarını değerlendirip düzeltmeyi öğrenir.

Nasıl çalışır?

İki aşamalı bir süreçten oluşur:

1. Gözetimli aşama (SL-CAI): Modele zararlı olabilecek bir soru sorulur. Model önce bir yanıt üretir, sonra anayasadaki ilkeleri referans alarak bu yanıtı eleştirir ve revize eder. Bu revize yanıtlar eğitim verisi olarak kullanılır.

2. Pekiştirmeli öğrenme aşaması (RL-CAI): Geleneksel RLHF'de insan değerlendiriciler hangi yanıtın daha iyi olduğunu işaretler. CAI'da ise bu görevi bir AI modeli üstlenir — anayasaya dayanarak iki yanıttan hangisinin daha uygun olduğuna karar verir. Bu süreç "RLAIF" (Reinforcement Learning from AI Feedback) olarak da bilinir.

Neden önemli?

Ölçeklenebilirlik: İnsan değerlendirmesi pahalı ve yavaştır. AI feedback bu süreci hızlandırır.
Şeffaflık: İlkeler yazılı olduğu için hangi değerlerin optimize edildiği görünürdür.
Tutarlılık: İnsan değerlendiricilerin kişisel yorumlarından kaynaklanan tutarsızlıkları azaltır.
Harmless + Helpful dengesi: Modelin sadece reddetmeyi öğrenmesini değil, hem yardımcı hem de güvenli olmayı öğrenmesini sağlar.

Kullanım alanları

Büyük dil modellerinin güvenlik eğitimi
Zararlı içerik üretimini azaltma
Model değerlendirme ve kıyaslama
AI güvenliği araştırmaları

Anayasal Yapay Zeka (Constitutional AI)

Constitutional AI nedir?

Nasıl çalışır?

Neden önemli?

Kullanım alanları

Ilgili terimler