Atoms ile kod yazmadan uygulama kur — AI ekibin senin için planlasın, kodlasın, deploy etsindene →
Ana Sayfa/Haberler/Fable 5'i Kapattıran Saldırı: 'Pack Hunt
AI Asistan

Fable 5'i Kapattıran Saldırı: 'Pack Hunt' Jailbreak'i Nasıl Çalıştı

VentureBeat·15 Haziran 2026·🔗 Kaynağa Git
Fable 5'i Kapattıran Saldırı: 'Pack Hunt' Jailbreak'i Nasıl Çalıştı

ABD hükümetinin Fable 5'i kapatmasının arkasında "Pliny the Liberator" takma adlı bir araştırmacının koordineli saldırısı vardı: zararlı istekleri masum alt sorulara bölüp cevapları birleştiren bir teknik.

Geçen hafta ABD hükümetinin Claude Fable 5 ve Mythos 5'e erişimi durdurmasının arkasında somut bir olay vardı: lansmandan bir gün sonra "Pliny the Liberator" takma adlı bir araştırmacının modelin güvenlik filtrelerini aşması. Bu jailbreakibir modelin güvenlik kısıtlamalarını aşma tekniği tek seferlik bir hile değil, koordineli bir saldırıydı.

Saldırı nasıl yürüdü

Pliny'nin "pack hunt" dediği yöntem bir çok ajanlı saldırıibirden fazla AI ajanının eşgüdümlü çalıştığı saldırı yapısı kullandı. Zararlı bir çıktıyı doğrudan istemek yerine, soruyu tek başına masum görünen alt parçalara böldü, her parçayı ayrı ayrı sordu, sonra cevapları birleştirdi. Tek tek her alt soru filtreyi geçecek kadar zararsızdı; birleşince değildi. Klasik keyword filtrelerini atlatmak için de Unicode, homoglyph ve Kiril harf değişimi kullandı.

Anthropic ne diyor

Anthropic'in cevabı net: aynı bilgi, hiçbir bypass gerektirmeden başka kamuya açık modellerden de alınabiliyor. Yani sorun Fable 5'e özgü değil; teknik çoğu sınır modelde işe yarıyor. Şirket ayrıca kendisine zararlı sonuç üreten bir jailbreak'in resmi olarak bildirilmediğini, sadece dar kapsamlı bir tekniğin sözlü olarak aktarıldığını söylüyor.

Neden önemli

Hükümet Fable 5'i kapatırken GPT-5.5 ve Gemini 3.1 Pro'yu açık bıraktı. Aynı saldırı tekniği onlarda da çalışabileceği için bu, tutarsız bir standart yaratıyor. Red teamingibir modeli kasıtlı zorlayıp açıklarını bulma testi topluluğu bunu görünür ama kökteki sorunu çözmeyen bir hamle olarak okudu.

mindi

Burada asıl mesele Fable 5'in "kırılması" değil, bir viral X postunun koca bir modeli rafa kaldırmaya yetmesi. Saldırı zekice ama yeni değil; parçala-birleştir mantığı yıllardır biliniyor. Senin için pratik sonuç: tek bir modele bağlı iş akışın varsa, o modelin bir sabah regülasyonla kapanabileceğini hesaba kat — yedek sağlayıcı artık lüks değil.

Benzer Haberler