article

Claude Sonnet 5: brangūs modeliai agentiniam AI nebėra būtinybė

Data: 2026 m. birželio 30 d.

„Anthropic" Claude Sonnet 5 atlieka agentines užduotis beveik taip pat gerai kaip Opus klasės modeliai, bet kainuoja perpus mažiau.

Trumpai (TL;DR):

Prieš kelis mėnesius agentiniam AI, kuris pats ieško informacijos, rašo kodą ir tikrina savo darbą, reikėjo brangiausio modelio. „Anthropic" dabar sako, kad to nebereikia. Claude Sonnet 5 daro tą patį už mažesnę kainą.

Kas pasikeitė nuo Sonnet 4.6

Sonnet klasė, 3.5 ir 3.7, pirmoji parodė, kad AI gali rimtai dirbti su kodu ir įrankiais. Tačiau aiškiausi agentinių gebėjimų šuoliai vyko Opus klasėje. Sonnet buvo pigus ir geras, Opus – brangus ir geriausias.

Sonnet 5 tą skirtumą labai sumažina. „Anthropic" pateiktos BrowseComp ir OSWorld-Verified testų diagramos rodo, kad Sonnet 5 pralenkia Sonnet 4.6 visose agentinėse užduotyse ir priartėja prie Opus 4.8. Opus vis dar tikslesnis, bet atotrūkis nebėra toks, kad jis automatiškai kainuotų dvigubai.

Ankstyvosios prieigos partneriai pastebi konkrečius dalykus: Sonnet 5 baigia sudėtingas užduotis ten, kur ankstesni Sonnet modeliai sustodavo. Jis tikrina savo paties rezultatus be atskiro nurodymo. Kūrėjai, kurie kuria tokius įrankius, tai daro be papildomo derybų rato su finansų skyriumi prieš kiekvieną API sąskaitą.

Kaina ir pasiekiamumas

Skaičiai: iki rugpjūčio 31 d. – $2 už milijoną įvesties tokenų ir $10 už milijoną išvesties. Po to standartinė kaina: $3 ir $15. Opus 4.8 kainuoja $5 ir $25. Skirtumas juntamas, kai agentinė užduotis per vieną seansą generuoja šimtus tūkstančių tokenų.

Modelis pasiekiamas visur. Nemokamam ir Pro planui jis tampa numatytuoju modeliu. Max, Team ir Enterprise vartotojai jį gauna kaip papildomą parinktį. Claude Code ir Claude Platform – taip pat. API eilutė: claude-sonnet-5.

„Anthropic" padidino ir greičio limitus visose platformose, nes aukštesni effort parametro lygiai sunaudoja daugiau tokenų. Kūrėjai pasirenka, kiek pastangų modelis skiria kiekvienai užduočiai, ir taip valdo kainos bei kokybės balansą.

Saugumas: ką „Anthropic" testuoja ir kodėl tai svarbu

„Anthropic" paskelbė detalius saugumo vertinimus. Sonnet 5 geriau atsispiria kenkėjiškiems nurodymams ir prompt injection atakoms nei Sonnet 4.6. Haliucinacijų bei pataikavimo rodikliai taip pat mažesni.

Kibernetinio saugumo srityje vaizdas įdomus. Kompanija tyčia netreniruodavo modelio kibernetinėms užduotims. Jis sugeba atlikti kasdienes, nekenksmingas operacijas, tačiau „Firefox" naršyklės pažeidžiamumų išnaudojimo teste Sonnet 5 nesugebėjo sukurti nė vieno veikiančio exploit'o. Opus 4.8 ir Claude Mythos Preview čia jį gerokai lenkia. Vis dėlto, kadangi Sonnet 5 šiek tiek pajėgesnis nei jo pirmtakas, „Anthropic" įjungė kibernetines apsaugos priemones standartiškai – tas pačias, kurios veikia Opus 4.7 ir 4.8 modeliuose.

Tai reiškia: modelis realiu laiku aptinka ir blokuoja pavojingus kibernetinio panaudojimo scenarijus. Mažiau griežtai nei Claude Fable 5, kuris blokuoja platesnį kibernetinių užduočių spektrą, tačiau apsauga yra.

Ką tai reiškia kūrėjams ir rinkai

Iki šiol agentinis AI reikalavo pasirinkimo: mokėk daugiau už Opus kokybę arba susitaikyk su Sonnet apribojimais. Sonnet 5 tą dilemą vidutinio sudėtingumo užduotims iš esmės panaikina.

Praktiškai: jei statai įrankį, kuris automatiškai ieško informacijos internete, struktūrizuoja duomenis ir rašo kodo fragmentus, Sonnet 5 greičiausiai pakankamas. Opus 4.8 verta laikyti ten, kur klaidoms nėra vietos ir kur tikslumas svarbesnis nei kelių šimtų eurų sutaupymas per mėnesį.

Lietuvos kūrėjų bendruomenei tai reiškia žemesnę įėjimo kainą į agentinį AI. Startuolis, kurio runway skaičiuojamas mėnesiais, gali statyti rimtesnius agentus be Opus kainos naštos.

Ponas Obuolys sako:

„Anthropic" šį kartą nepadavė visiems to paties pyrago, tik perpus mažesnio. Sonnet 5 yra kitoks kompromisas: mažesnė kaina, mažesnis tikslumas aukščiausiuose reitinguose, bet agentiniam darbui pakankamas. Tai, kad modelis tikrina savo darbą be atskiro nurodymo, nėra marketingo triukas. Tai esminis skirtumas tarp modelio, kuriam reikia prižiūrėtojo, ir modelio, kuris tiesiog dirba.

Skeptiko pastaba: starto kainos galioja iki rugpjūčio 31 d., po to standartinė kaina $3/$15. Kūrėjai, kurie statys architektūrą šią vasarą, turėtų skaičiuoti ilgalaikę kainą, o ne starto akcijos skaičius. Bandomosios kainos yra seniausias triukas knygoje – ir veikia iki šiol.

Dar vienas dalykas: „Anthropic" gana atvirai kalba apie tai, kad Sonnet 5 kibernetinių gebėjimų atžvilgiu silpnesnis nei Opus. Industrijai, kurioje kiekvienas modelis reklamuojamas kaip universalus čempionas, tai neįprastas skaidrumas. Vertinu. Nors tai ir patogu: nepatogi kibernetinio saugumo tema neutralizuojama „mes tyčia to nemokėme" argumentu.

Šaltiniai: „Anthropic" oficialus pranešimas „Introducing Claude Sonnet 5", Claude Sonnet 5 System Card.

Temos

Susijusios naujienos