article

„OpenAI" tyliai diegia GPT-Image-2: tekstas grafikoje pagaliau veikia

Data: 2026 m. balandžio 21 d.

„OpenAI" pradėjo ribotą GPT-Image-2 diegimą mokantiems „ChatGPT" vartotojams. Naujasis modelis žada 99 proc. teksto atvaizdavimo tikslumą ir gali iš esmės pakeisti dizainerių bei rinkodaros specialistų darbo įrankius.

Trumpai (TL;DR):

Niekas oficialiai nieko nepranešė. Tačiau mokami „ChatGPT" vartotojai visame pasaulyje ėmė pastebėti kažką neįprasto: generuojamos nuotraukos atrodė kitaip ir geriau. Teksto raidės nesipynė į nesuprantamas figūras. Geltono atspalvio, persekiojusio ankstesnį modelį, neliko nė pėdsako. Taip, be jokių oficialių pranešimų, „OpenAI" paleido GPT-Image-2.

Kaip išaiškėjo modelis, kuris oficialiai neegzistuoja

Balandžio 4 d. LM Arena platformoje staiga pasirodė trys anoniminiai vaizdo generavimo modeliai su kodiniais pavadinimais maskingtape-alpha, gaffertape-alpha ir packingtape-alpha. Vaizdo kokybė nustebino testuotojus: beveik tobulas teksto atvaizdavimas, dingęs geltonas atspalvis ir tikslus pasaulio vaizdavimas. Po kelių valandų visi trys modeliai dingo.

Trys variantai vienu metu rodo ne ankstyvą prototipų testavimą, o paskutinius lyginamojo vertinimo etapus. Tai buvo galutinis balo rinkimas prieš išleidimą.

Nuo balandžio 16 d. socialiniuose tinkluose pradėjo rastis pranešimų, kad „OpenAI" įjungė A/B testavimą su GPT-Image-2 „ChatGPT" sąsajoje. Vaizdo generavimo funkcija dalį užklausų nukreipia į naująjį modelį. Kai kurie vartotojai patenka į sistemą, kurioje renkasi geresnį iš dviejų rezultatų.

Teksto problema, kuri gėdino visą AI vaizdo kūrimo pramonę

Metai po metų AI vaizdo generavimo modeliai turėjo vieną skaudžią spragą: tekstas nuotraukose tiesiog neveikė. Raidės susipindavo, žodžiai išsikraipydavo, o iš pažiūros graži reklaminio plakato grafika virsdavo juokų objektu socialiniuose tinkluose.

GPT Image 1.5 jau pasiekė apie 95 proc. tikslumą lotyniškam tekstui, tačiau vis dar sunkiai susidorojo su kitomis rašmenų sistemomis: CJK (kinų, japonų, korėjiečių) ir arabų. GPT-Image-2 tikimasi pakels tikslumą iki daugiau nei 99 proc. ir užtikrins visapusišką daugiakalbio teksto palaikymą.

Lietuvos rinkodaros ir dizaino specialistams čia slypi praktinė šios naujienos esmė. Iki šiol teksto įterpimas į lietuvišką grafiką buvo arba rankų darbas „Photoshop" programoje, arba nepakankamos kokybės eksperimentas. Dabar tampa įmanoma tai, kas anksčiau buvo nepasiekiama. Dizaineris gali paprašyti modelio sugeneruoti produkto maketą su konkrečiu reklaminiu šūkiu. Socialinių tinklų komanda – kurti vizualinį turinį pagal prekės ženklą. Startuolis – gaminti spaudai paruoštą reklamą be grafiko. Kiekvienas iš šių žingsnių dabar tampa tikroviškai įgyvendinamas. GPT-Image-2 pereina iš kūrybinio žaislo į gamybos įrankį.

„DALL-E" pensija ir tikroji laiko spaudimo priežastis

GPT-Image-2 neatsiranda tuščioje vietoje. „OpenAI" paskelbė, kad 2026 m. gegužės 12 d. uždarys DALL-E 2 ir DALL-E 3 modelius ir ragina kūrėjus pereiti prie gpt-image-1.5 arba gpt-image-1-mini.

GPT-Image-2 paleidimas iki gegužės 12 d. suteikia kūrėjams aiškų migracijos tikslą. Dar svarbiau: GPT Image modelių šeima architektūriškai skiriasi nuo DALL-E. Ji naudoja autoregresinę generaciją tiesiogiai kalbos modelio viduje, o ne atskirą difuzijos modelį. Tai ne paprastas atnaujinimas, o visiškai kita technologinė filosofija.

Sora vaizdo generavimo paslauga buvo išjungta 2026 m. kovo 24 d., atlaisvinant didelius GPU skaičiavimo pajėgumus. Plačiai spėjama, kad šie pajėgumai nukreipti į galutinius GPT-Image-2 mokymo etapus ir didelio masto beta testavimą.

Kas laukia: datos, kainos, API

GPT-Image-2 diegiamas palaipsniui. Pirmiausia prieiga suteikiama „ChatGPT Plus", „Team" ir „Enterprise" prenumeratoriams. API prieiga planuojama gegužės pradžioje.

Tikimasi, kad oficialiai išleidus API, vieno vaizdo kaina svyruos nuo 0,15 iki 0,20 USD. Palyginimui: dabartinis GPT Image 1.5 kainuoja apie 0,06–0,12 USD. Naujasis modelis brangesnis, tačiau ir galimybių spektras kur kas platesnis.

GPT-Image-2 šiuo metu atrodo kaip stipriausias modelis praktiniam, į darbo procesą integruotam vaizdo generavimui, ypač ten, kur svarbus teksto tikslumas. Jis nėra pozicionuojamas kaip meninis įrankis, konkuruojantis su „Midjourney". Jis pozicionuojamas kaip patikimas gamybos įrankis.

Ponas Obuolys sako:

Įdomiausia šioje istorijoje ne pats modelis, o tai, kaip jis pasirodė pasaulyje. Jokio oficialaus pranešimo, jokios konferencijos, jokių spaudos pranešimų. Tik keli smalsūs vartotojai socialiniuose tinkluose, kurie pastebėjo, kad jų generuojamos nuotraukos staiga atrodo kitaip. „OpenAI" vis labiau mėgsta tylią taktiką: išleisk per A/B testą, leisk bendruomenei pačiai surasti, o tada oficialiai paskelbk tai, ką visi jau žino. Genialus PR triukas ar tiesiog chaotiškas valdymas? Greičiausiai abu.

Dėl turinio: tekstas grafikoje buvo ta vieta, kur AI vaizdo generavimas atrodė juokingai. Lietuvis rinkodaros specialistas, bandęs sugeneruoti banerį su užrašu „Vasaros išpardavimas" ir taisyklingomis raidėmis, žino, apie ką kalbu. Jei 99 proc. tikslumas tikrai pasitvirtins realiame naudojime, o tai dar reikia įrodyti, tai yra tikras poslinkis, o ne vien benchmark žaidimas.

Tik vienas dalykas neramina. „OpenAI" vienu metu uždaro „DALL-E", išjungė „Sora" ir dabar diegia naują modelį be oficialaus pranešimo. Susidaro įspūdis, kad kairė ranka nežino, ką daro dešinė. Arba žino pernelyg gerai.

Šaltiniai: „AI Market Watch", „Startup Fortune", „Apiyi.com Blog", „MindStudio", „felloai.com", „OpenAI Developer Community".

Temos

Susijusios naujienos

AI Kursai