„Claude Fable 5" grįžta: kaip vienas „Amazon" raportas sustabdė du AI modelius 18 dienų

Data: 2026 m. liepos 1 d.

Anthropic" paaiškino, kodėl JAV vyriausybė birželio 12 d. uždėjo eksporto kontrolę „Claude Fable 5" ir „Claude Mythos 5" bei kaip modeliai grįžta liepos 1 d.

Trumpai (TL;DR):

JAV vyriausybė birželio 12 d. taikė eksporto kontrolę „Claude Fable 5" ir „Claude Mythos 5", kai „Amazon" tyrėjai rado būdą apeiti modelio apsaugos filtrus ir priversti jį generuoti programinių pažeidžiamumų išnaudojimo kodą.
„Anthropic" patikrinimas parodė, kad tą patį galėjo padaryti ir silpnesni modeliai: „Claude Haiku 4.5", „GPT-5.5" ir „Kimi K2.7". Unikalaus pavojaus techniškai nebuvo.
Incidentas atskleidė struktūrinę spragą: AI pramonėje nėra bendro standarto vertinti jailbreak technikų pavojingumą. Dabar „Anthropic" kartu su „Amazon", „Microsoft" ir „Google" kuria tokį standartą.

Birželio 9 d. „Anthropic" išleido du naujus modelius. Birželio 12 d. JAV vyriausybė juos faktiškai sustabdė. 18 dienų „Claude Fable 5" ir „Claude Mythos 5" buvo neprieinami niekam: nei amerikiečiams, nei likusiam pasauliui. Birželio 30 d. eksporto kontrolė panaikinta, o liepos 1 d. „Fable 5" grįžta į visas platformas.

Kas atsitiko per tris dienas nuo paleidimo iki blokados

„Amazon" tyrėjai rado metodą, leidžiantį priversti „Fable 5" identifikuoti programinių sistemų pažeidžiamumus. Vienu atveju modelis sugeneravo kodą, rodantį, kaip konkretų pažeidžiamumą galima išnaudoti. Ataskaita pasiekė JAV vyriausybę. Reakcija buvo nedelsiant.

Eksporto kontrolės direktyva įsigaliojo tą pačią dieną, kai buvo paskelbta. „Anthropic" neturėjo galimybės realiu laiku patikrinti vartotojų pilietybės, todėl sustabdė prieigą visiems be išimčių.

Sustabdymas nebuvo katastrofiškas pažeidimas. Pati „Anthropic" tai vadina borderline case, t. y. ribinio atvejo situacija, kai modelis elgėsi paribyje to, ko neturėtų daryti. Skirtumas tarp „pažeidė saugiklį" ir „pažeidžiamumas, kurį bet kuris kitas modelis taip pat išnaudoja", čia labai svarbus.

Kodėl techniškai tai buvo ne katastrofa, bet politiškai tapo precedentu

„Anthropic" patikrino: tas pačias programines spragas, kurias „Fable 5" identifikavo apeidamas apsaugos filtrus, galėjo identifikuoti ir „Claude Opus 4.8", ir „GPT-5.5", ir kinų „Kimi K2.7". Pažeidžiamumo išnaudojimo demonstracinį kodą generavo visi išbandyti modeliai, įskaitant „Claude Haiku 4.5" – mažiausią ir pigiausią iš šeimos.

„Fable 5" nepadarė nieko, ko jau negalėtų padaryti pigesnės alternatyvos. Unikalaus grėsmės lygio nebuvo. Tačiau vyriausybė vis tiek veikė.

Tai ir yra esminis šios istorijos žodis – ne „jailbreak", o precedentas. Reguliuotojai parodė, kad yra pasirengę stabdyti pirmaujančius modelius net dėl ribinių atvejų. Kai standarto nėra, sprendimą priima valdžia pagal savo vertinimą.

Klasifikatoriaus dilema: saugiau, bet su kaina

Per 18 dienų „Anthropic" sukūrė naują saugos klasifikatorių – automatinį filtrą, blokuojantį „Amazon" tyrėjų rastą metodą. Efektyvumas: daugiau nei 99 % atvejų technika nebeveikia. JAV Prekybos departamento Dirbtinio intelekto standartų ir inovacijų centras (CAISI) patikrino ir patvirtino, kad nauja apsauga yra išskirtinai stipri.

Tačiau „Anthropic" sąžiningai pripažįsta kompromisą. Naujas klasifikatorius padidino klaidingų teigiamų rezultatų skaičių su teisėtomis programavimo ir derinimo užduotimis. Praktiškai tai reiškia: programuotojas, naudojantis „Fable 5" kasdieniam darbui, gali sulaukti atsisakymų ten, kur senasis modelis padėjo. Saugiau, bet su trinties kaina.

„Anthropic" taip pat konstatuoja tai, ką daugelis ir taip žinojo: tikriausiai neįmanoma padaryti jokio AI modelio visiškai atsparaus jailbreak technikoms. Tai oficiali pozicija, įrašyta į dokumentą.

„Mythos 5" lieka kitur: dviejų greičių AI rinka

„Fable 5" grįžta visiems. „Mythos 5" – ne. Liepos 1 d. jis lieka prieinamas tik patvirtintoms JAV organizacijoms pagal „Project Glasswing" programą, kuri ir iki tol veikė kaip atskira, vyriausybės prižiūrima platforma labiausiai pajėgiems modeliams.

„Anthropic" paties apibūdinimu, „Claude Mythos 5" gali rasti ir išnaudoti programinius pažeidžiamumus efektyviau nei bet kuris kitas modelis ir efektyviau nei dauguma kibernetinio saugumo ekspertų. Tai ir yra priežastis, kodėl šio modelio nėra laisvoje rinkoje. Ir greičiausiai niekada nebus.

Tai ne laikinas apribojimas. Tai strategija. Patys pajėgiausi modeliai bus prieinami tik patikrintoms organizacijoms per vyriausybiškai prižiūrimas programas. Vartotojui skirta versija yra „Fable 5" su papildomais saugikliais. Tokia rinkos bifurkacija tikriausiai taps pramonės norma.

**Pramonė be standarto: kaip vertinti jailbreak pavojingumą**

Incidentas atskleidė, kad AI pramonėje šiandien nėra sutartos metodikos atsakyti į klausimą: ar konkretus jailbreak yra rimtas pavojus, ar tik dirgiklis? „Anthropic" tai formuluoja tiesiai: „Šiuo metu AI pramonėje nėra konsensuso, kaip objektyviai įvertinti jailbreak pažeidžiamumo rimtumą."

Vakuumą užpildo valdžios institucijos savo vertinimu. Tai nepatogi situacija visiems.

Todėl „Anthropic", „Amazon", „Microsoft", „Google" ir kiti „Glasswing" partneriai dabar kuria bendrą vertinimo sistemą pagal keturis kriterijus: galimybių prieaugis, to prieaugio platumas, ginklavimo lengvumas ir atrandamumas. Sistema savanoriška, bet plačiau pritaikyta galėtų tapti reguliacijos pagrindu.

Kartu „Anthropic" siūlo vyriausybei sustiprintą bendradarbiavimo paketą: išankstinė prieiga nacionalinio saugumo vertinimams prieš paleidimą, greitas pranešimas apie rastas jailbreak technikas, bendros tyrėjų komandos, dalijimasis skaičiavimo resursais. Tai reikšmingas valstybės vaidmens išplėtimas AI sprendimuose, ir ši schema gali tapti privalomosios reguliacijos šablonu.

Ponas Obuolys sako:
Penktadienis, birželio 12 d. Kažkur Vašingtone kažkas perskaitė „Amazon" ataskaitą ir parašė direktyvą. Per savaitgalį „Anthropic" inžinieriai sugrįžo prie klaviatūrų. Pusantros savaitės vėliau: naujas klasifikatorius, CAISI patvirtinimas ir žalias signalas. Taip šiandien atrodo AI reguliacija: sprendimas per dieną, peržiūra per savaitę, precedentas amžinai.
Techniškai „Fable 5" nepadarė nieko ypatingo – „Haiku 4.5" darė tą patį. Bet politiškai tai nesvarbu. Kai nėra objektyvaus sunkumo vertinimo standarto, valdžia sprendžia pagal tai, kas atrodo blogai. Visi kiti modeliai, galintys tą patį, toliau veikė be trukdžių – antraštės buvo pilnos tik „Anthropic".
„Mythos 5" – atskira istorija. Jei modelis randa pažeidžiamumų efektyviau nei dauguma ekspertų, jis ir neturėtų būti laisvai parduodamas. „Anthropic" pozicija čia logiška. Nelogiška tik tai, kad tokia sistema susiformavo ne dėl aiškios politikos, o dėl vieno „Amazon" raporto, kuris atsitiktinai atsirado tinkamu laiku.

Šaltiniai: „Anthropic" tinklaraštis „Redeploying Fable 5", 2026 m. birželio 30 d.