Fable 5'i Kapattıran Saldırı: 'Pack Hunt' Jailbreak'i Nasıl Çalıştı

ABD hükümetinin Fable 5'i kapatmasının arkasında "Pliny the Liberator" takma adlı bir araştırmacının koordineli saldırısı vardı: zararlı istekleri masum alt sorulara bölüp cevapları birleştiren bir teknik.
Geçen hafta ABD hükümetinin Claude Fable 5 ve Mythos 5'e erişimi durdurmasının arkasında somut bir olay vardı: lansmandan bir gün sonra "Pliny the Liberator" takma adlı bir araştırmacının modelin güvenlik filtrelerini aşması. Bu jailbreaki
bir modelin güvenlik kısıtlamalarını aşma tekniği tek seferlik bir hile değil, koordineli bir saldırıydı.
Saldırı nasıl yürüdü
Pliny'nin "pack hunt" dediği yöntem bir çok ajanlı saldırıi
birden fazla AI ajanının eşgüdümlü çalıştığı saldırı yapısı kullandı. Zararlı bir çıktıyı doğrudan istemek yerine, soruyu tek başına masum görünen alt parçalara böldü, her parçayı ayrı ayrı sordu, sonra cevapları birleştirdi. Tek tek her alt soru filtreyi geçecek kadar zararsızdı; birleşince değildi. Klasik keyword filtrelerini atlatmak için de Unicode, homoglyph ve Kiril harf değişimi kullandı.
Anthropic ne diyor
Anthropic'in cevabı net: aynı bilgi, hiçbir bypass gerektirmeden başka kamuya açık modellerden de alınabiliyor. Yani sorun Fable 5'e özgü değil; teknik çoğu sınır modelde işe yarıyor. Şirket ayrıca kendisine zararlı sonuç üreten bir jailbreak'in resmi olarak bildirilmediğini, sadece dar kapsamlı bir tekniğin sözlü olarak aktarıldığını söylüyor.
Neden önemli
Hükümet Fable 5'i kapatırken GPT-5.5 ve Gemini 3.1 Pro'yu açık bıraktı. Aynı saldırı tekniği onlarda da çalışabileceği için bu, tutarsız bir standart yaratıyor. Red teamingi
bir modeli kasıtlı zorlayıp açıklarını bulma testi topluluğu bunu görünür ama kökteki sorunu çözmeyen bir hamle olarak okudu.

Burada asıl mesele Fable 5'in "kırılması" değil, bir viral X postunun koca bir modeli rafa kaldırmaya yetmesi. Saldırı zekice ama yeni değil; parçala-birleştir mantığı yıllardır biliniyor. Senin için pratik sonuç: tek bir modele bağlı iş akışın varsa, o modelin bir sabah regülasyonla kapanabileceğini hesaba kat — yedek sağlayıcı artık lüks değil.