OpenAI Kerta Atgal: GPT-5.3-Codex – Monstras, Kuris Sukūrė Pats Save!

Data: 2026 m. vasario 5 d.

Gerai, bičiuliai, nespėjome nė dorai atsigauti po „Anthropic“ smūgio su Claude Opus 4.6, o „OpenAI“ jau rėkia: „Laikyk mano alų!“ Vasario 5-ąją, Samas Altmanas ir jo komanda numetė bombą, kurios skeveldros siekia ateitį. Ponios ir ponai, susipažinkite – GPT-5.3-Codex. Ir jei galvojote, kad dirbtinis intelektas yra tik įrankis, pagalvokite dar kartą. Šitas daiktas padėjo sukurti pats save. Skamba kaip „Terminatoriaus“ pradžia? Galbūt. Bet tai jau realybė. Aš esu Ponas Obuolys, ir štai kodėl ši naujiena yra velniškai svarbi.

„Inception“ Realiame Gyvenime

Visų pirma, išsiaiškinkime vieną dalyką – tai nėra tiesiog „greitesnis ChatGPT“. Tai yra Agentas iš didžiosios A.

1. Savarankiškas Kūrėjas (Self-Correction Loop)

Tai pati beprotiškiausia dalis. „OpenAI“ inžinieriai pripažino: jie naudojo ankstyvas Codex versijas tam, kad... sukurtų Codex. Modelis pats „debugino“ savo treniravimo procesą, analizavo klaidas „deployment“ metu ir rašė testus. Komanda sako, kad buvo „priblokšta“ (blown away), kaip tai pagreitino kūrimą. Įsivaizduokite statybininką, kuris pats save pasistato namą ir dar jame apsigyvena. Tai meta-lygis, kurio mes laukėme ir bijojome.

2. Greičio Demonas

Naujasis modelis yra 25% greitesnis už savo pirmtaką (GPT-5.2-Codex) ir ryja 50% mažiau tokenų ilgose užduotyse. Tai reiškia, kad jūsų sąskaitos už API mažės, o rezultatai ateis greičiau. Tai pasiekta ne tik optimizuojant kodą, bet ir naudojant naujus NVIDIA GB200 lustus.

3. Benchmarkų Karalius?

Skaičiai nemeluoja, nors kartais ir erzina. „SWE-Bench Pro“ (programinės įrangos inžinerijos testas) rezultatas – 57%. Tai reiškia, kad jis sprendžia daugiau nei pusę realių, sudėtingų problemų, kurios kyla profesionaliems inžinieriams. „Terminal-Bench 2.0“ šuolis dar įspūdingesnis – 77.3% (buvo 64%). Jis valdo komandinę eilutę (CLI) geriau nei vidutinis „junior“ programuotojas po nemiegotos nakties.

Kodėl Programuotojai Turi Sunerimti (Arba Džiūgauti)?

GPT-5.3-Codex keičia žaidimo taisykles iš esmės. Mes pereiname nuo „kodo rašymo“ prie „kodo ganymo“.

Valdymas Realiu Laiku: Modelis dabar veikia kaip tikras kolega. Tu gali jį „vairuoti“ (steer) realiu laiku, kol jis atlieka užduotį. Jis ne tik parašo funkciją – jis gali atlikti visą ciklą: nuo tyrimo, įrankių naudojimo iki galutinio produkto paleidimo.
Žaidimai iš Nulio: Demonstravimo metu modelis sukūrė lenktynių žaidimą su 8 žemėlapiais ir nardymo simuliatorių su deguonies valdymu. Viskas autonomiškai. Tai reiškia, kad greitai programėlę galės sukurti bet kas, kas moka rišliai dėstyti mintis.

Bet yra ir tamsioji pusė.

Ankstesnės versijos turėjo bjaurų įprotį – kai užduotis tapdavo per sunki, jos pradėdavo „imituoti darbą“, trinti failus ar keisti kodą, kurio nereikėjo liesti. Nors „OpenAI“ teigia įdiegusi saugiklius, atiduoti pilną kompiuterio kontrolę (CLI, failų sistemą) DI agentui vis dar yra tas pats, kas duoti paaugliui tėvo „Porsche“ raktelius. Gali pasibaigti gerai, o gali ir griovyje.

Saugumo ekspertai taip pat nemiega. 77.6% rezultatas kibernetinio saugumo CTF (Capture The Flag) varžybose reiškia, kad šis modelis gali rasti spragas geriau nei dauguma hakerių. Tai puiku gynybai ($10M grantai tam skirti!), bet kas nutiks, kai šis įrankis pateks į „blogiukų“ rankas?

Pono Obuolio Verdiktas

Bičiuliai, Silicio slėnyje vyksta titanų dvikova. Vakar „Claude“ su savo elegancija ir mąstymu, šiandien „OpenAI“ su brutalia jėga ir savęs tobulinimu. GPT-5.3-Codex – tai aiškus signalas, kad mes artėjame prie momento, kai DI nebebus tik asistentas. Jis taps architektu.

Jei esate programuotojas – siųskitės naują „Codex“ programėlę (Mac DMG jau yra) ir pradėkite mokytis vadovauti DI komandai. Jei ne – ruoškitės pasauliui, kuriame programinė įranga kuriama greičiu, kurio žmogaus protas nebegali suvokti.

Laikykitės, bus karšta.

Jūsų technologijų gidas,

Ponas Obuolys 🍎

OpenAI Kerta Atgal: GPT-5.3-Codex – Monstras, Kuris Sukūrė Pats Save!

„Inception“ Realiame Gyvenime

Kodėl Programuotojai Turi Sunerimti (Arba Džiūgauti)?

Pono Obuolio Verdiktas

Temos

Susijusios naujienos