article

Claude Science: AI tyrėjas, kuris pats atidaro duomenų bazes ir nesugalvoja skaičių

Data: 2026 m. birželio 30 d.

Claude Science mokslininkams jungia duomenų analizę, prieigą prie 60+ mokslinių duomenų bazių ir automatinį figūrų bei kodo suderinamumo tikrinimą.

Trumpai (TL;DR):

Žurnalai kassmet atšaukia šimtus straipsnių, nes rezultatų negalima atkartoti. Dažniausios priežastys: kodas pakeistas po to, kai figūra jau buvo sugeneruota, arba citata parašyta iš atminties, ne iš šaltinio. „Anthropic" teigia, kad „Claude Science" šią problemą sprendžia struktūriškai, o ne per discipliną.

Kas yra „Claude Science" ir kuo ji skiriasi nuo paprasto Claude

„Claude Science" nėra Claude su moksliniu prompt'u (užklausa). Tai atskira programa su nuolatiniais „Python" ir „R" branduoliais: kintamieji ir modeliai išlieka atmintyje per visą sesiją. Tyrėjas gali grįžti prie pradėtos analizės po valandos ir nereikės viską paleisti iš naujo.

Svarbiausias architektūrinis sprendimas: kiekvienas sugeneruotas grafikas, lentelė ar užrašų knygelė turi savo istoriją. Tikslus kodas, aplinkos nustatymai, net pokalbio kontekstas, kuriame tas rezultatas buvo sukurtas. „Anthropic" atkuriamumą įvardija ne kaip papildomą funkciją, o kaip pagrindinį veikimo principą.

Fono recenzentas: sistema, tikrinanti pati save

Čia glūdi neįprastas elementas. „Claude Science" turi foninį recenzentą, kuris nuolat stebi, ar citatos atsekamos, ar skaičiai kyla iš duomenų ir ar figūros atitinka jas sugeneravusį kodą. Sistema bando pagauti save klystant.

Didžiausia baimė naudojant AI moksle yra haliucinacija – ne abstrakti, o labai konkreti: AI parašo p reikšmę, kurios niekada neskaičiavo, arba nurodo straipsnį, kurio nėra. Jei fono recenzento mechanizmas veikia patikimai, tai rimtas atsakymas į tą baimę. Kol nėra nepriklausomų testų, „veikia patikimai" lieka deklaracija.

60+ duomenų bazių: nuo genomikos iki cheminformatikos

„Claude Science" iš anksto sukonfigūruota keliems moksliniams domenams: genomikai, vienos ląstelės analizei, proteomikai, struktūrinei biologijai, cheminformatikai. Sistema prijungta prie daugiau nei 60 mokslinių duomenų bazių ir pati žino, kaip kreiptis į tinkamą šaltinį.

Baltymų struktūras, genominių sekų rodmenis ir chemines struktūras galima peržiūrėti tiesiogiai programoje, be papildomų įrankių. Tai reiškia, kad laboratorija Kaune ar Vilniuje gali dirbti su tomis pačiomis duomenų bazėmis, kurių prieigai didelė institucija išlaiko atskirą specialistą.

Skaičiavimai: nuo nešiojamojo kompiuterio iki klasterio

„Claude Science" valdo kompiuterinius išteklius: rašo paketinių užduočių skriptus, perduoda darbus per SSH į vartotojo mašinas arba HPC (didelio našumo kompiuterijos) klasterius, jungiasi per „Modal" paskyrą. Sistema vienodai orientuojasi tiek su vienu GPU, tiek su šimtais.

Labiausiai tai svarbu tiems, kurie šiuo metu praleidžia dienas rašydami SLURM skriptus, laukdami eilėje ir derinydami aplinkas. Jei „Claude Science" iš tikrųjų automatizuoja tą administracinį darbą, mokslininkas atgauna realias valandas per savaitę.

Nuo duomenų iki rankraščio viename lange

„Claude Science" leidžia rašyti straipsnio projektą ten pat, kur atliekama analizė. „Markdown" ir „LaTeX" peržiūra įdiegta iš karto. Figūrą galima apibūdinti paprasta kalba, paprašyti pakeitimo – ir sistema pati nuskaito kodą, kuris tą figūrą sugeneravo, bei keičia tiesiogiai.

Tai panaikina vieną labiausiai erzinančių mokslininkų rutinų: nuolatinį perjunginėjimą tarp analizės aplinkos, vaizdinimo įrankio ir teksto redaktoriaus, bandant išlaikyti viską suderinta.

Ponas Obuolys sako:

„Claude Science" yra vienas iš nedaugelio AI produktų, kurį kuriant buvo susimąstyta apie realią problemą, o ne tik pridėta naujų funkcijų. Mokslinio kodo atkuriamumas nepadaro įspūdžio demo vaizdo įraše. Bet jo nebuvimas yra priežastis, kodėl mokslininkai po dvejų metų nebegali pakartoti savo disertacijos rezultatų. Jei fono recenzento mechanizmas veikia, kaip aprašyta, jis vertas daugiau nei devynios dešimtys antraščių apie AI ir mokslą.

Yra vienas „bet". „Claude Science" šiuo metu yra beta, o mokslas yra žiauriai specifinis dalykas. Genomikos mokslininkas ir chemijos mokslininkas gyvena skirtinguose pasauliuose. 60 duomenų bazių skamba gerai iki pirmo atvejo, kai būtent reikalingos trūksta. Tikrieji testai ateis ne iš „Anthropic" komunikacijos, o iš laboratorijų, kurios šį įrankį naudos šešis mėnesius su realiais duomenimis ir realiais terminais.

Lietuva čia turi konkretų kampą. Mūsų biotechnologijų ir bioinformatikos bendruomenė nėra maža, bet turi nedidelių institucijų trūkumų: mažiau IT palaikymo, mažiau infrastruktūros biudžeto. Jei „Claude Science" iš tikrųjų sumažina techninio administravimo naštą, labiausiai tai pajus ne MIT laboratorija su penkiais bioinformatikos specialistais, o trijų žmonių grupė Santaros klinikose, kuri nori atlikti rimtą analizę, bet neturi kam sukonfigūruoti klasterio.

Šaltiniai: „Anthropic" „Claude Science" oficialus pristatymas.

Temos

Susijusios naujienos