
Anthropic perspėja, kad DI kūrimas pereina į fazę, kurioje modeliai vis labiau kuria patys save
„Anthropic“ paskelbė analizę „When AI builds itself“, kurioje teigia, kad DI sistemos vis didesnę dalį DI kūrimo ciklo atlieka pačios. Bendrovė pabrėžia, kad žmonės vis dar nustato tikslus, tikrina rezultatus ir priima svarbiausius sprendimus, tačiau vis daugiau praktinio darbo – nuo kodo rašymo iki eksperimentų vykdymo – jau perduodama Claude modeliams.
Pagrindinė „Anthropic“ tezė – jei ši kryptis tęsis, DI sistemos gali priartėti prie vadinamojo rekursyvaus savęs tobulinimo. Tai reikštų, kad modelis ne tik padeda žmogui kurti naują DI versiją, bet ir pats gali vis savarankiškiau projektuoti, testuoti ir tobulinti savo įpėdinius. „Anthropic“ aiškiai nurodo, kad tokio lygio dar nepasiekta ir jis nėra neišvengiamas, tačiau bendrovė mano, kad jis gali ateiti greičiau, nei dauguma institucijų tam pasirengusios.
„The Independent“ šią žinią pateikė per aštresnę prizmę: „Anthropic“ esą perspėja apie riziką, kad žmonės gali prarasti DI sistemų kontrolę. Toks teiginys remiasi pačios bendrovės formuluote, jog visiškas rekursyvus savęs tobulinimas galėtų padidinti riziką, kad žmonės nebesuvaldys DI sistemų krypties, saugumo ir elgesio.
Claude jau parašo daugiau kaip 80 proc. kodo, kuris įtraukiamas į Anthropic produktų bazę
Ryškiausias skaičius – daugiau kaip 80 proc. kodo, kuris 2026 m. gegužę buvo įtraukiamas į „Anthropic“ gamybinę kodų bazę, buvo parašytas Claude. Prieš Claude Code tyrimų versijos paleidimą 2025 m. vasarį šis rodiklis buvo tik žemų vienaženklių procentų lygyje.
Bendrovė taip pat skelbia, kad 2026 m. antrąjį ketvirtį įprastas jos inžinierius per dieną įtraukdavo maždaug aštuonis kartus daugiau kodo nei 2024 m. „Anthropic“ pati pripažįsta, kad kodo eilučių kiekis nėra idealus produktyvumo matas, nes jis rodo kiekį, o ne kokybę, tačiau bendrovė šį šuolį vertina kaip realų DI pagreitinto darbo požymį.
Dar vienas konkretus pavyzdys – 2026 m. balandį Claude esą įdiegė daugiau kaip 800 pataisų, kurios vienos rūšies API klaidų skaičių sumažino tūkstantį kartų. Šį darbą prižiūrėjęs inžinierius, pagal „Anthropic“ pateiktą vertinimą, skaičiavo, kad žmogui tokia užduotis galėjo trukti ketverius metus. Šis skaičius yra bendrovės vidinis vertinimas, todėl jo nereikėtų skaityti kaip nepriklausomo audito išvados.
DI modeliai vis geriau atlieka užduotis, bet sprendimų kryptį vis dar turi nustatyti žmogus
„Anthropic“ teigia, kad Claude jau gali spręsti ne tik aiškiai apibrėžtas kodo užduotis, bet ir vis atviresnes inžinerines problemas. Pačios bendrovės duomenimis, sudėtingiausių atvirų užduočių sėkmės rodiklis 2026 m. gegužę pasiekė 76 proc. ir per šešis mėnesius pakilo 50 procentinių punktų.
Vis dėlto bendrovė pripažįsta, kad didžiausia spraga lieka ten, kur reikia pasirinkti ne metodą, o patį tikslą. Claude gali vykdyti eksperimentą, taisyti kodą, ieškoti gedimo ar sukurti sprendimą pagal nurodytą kryptį, tačiau „Anthropic“ pabrėžia, kad žmonių pranašumas tebėra platesnis vaizdas, tyrimo skonis, prioritetų nustatymas ir sprendimas, kuri problema iš viso verta darbo.
Tai yra esminis skirtumas tarp galingo darbo įrankio ir savarankiškai save tobulinančios DI laboratorijos. Kol žmogus nustato kryptį, modelis išlieka labai produktyvus vykdytojas. Pavojingesnis scenarijus prasidėtų tada, jei modeliai patys pradėtų rinktis tyrimų kryptis, kurti naujas architektūras, testuoti savo įpėdinius ir spartinti visą ciklą be realios žmogaus kontrolės.
Anthropic siūlo globalų stabdžių mechanizmą, bet pripažįsta, kad vienos bendrovės pauzė mažai ką pakeistų
„Anthropic“ siūlo pasauliui turėti galimybę sulėtinti arba laikinai sustabdyti pažangiausių DI sistemų kūrimą, jei rizikos pradėtų augti greičiau, nei visuomenė ir saugumo tyrimai spėtų prisitaikyti. Reuters nurodo, kad bendrovė ragina kurti koordinuotą ir patikrinamą mechanizmą, pagal kurį didžiosios DI laboratorijos galėtų stabdyti plėtrą, jei modeliai imtų patys save tobulinti per greitai.
Bendrovė kartu pripažįsta pagrindinę problemą: vienos įmonės savanoriška pauzė gali neturėti didelės prasmės, jei konkurentai toliau judėtų pirmyn. Tokiu atveju lėčiau veikianti laboratorija tiesiog prarastų lyderystę, o bendras saugumas nebūtinai pagerėtų. Todėl „Anthropic“ kalba apie kelių gerai finansuojamų, technologijų fronte esančių laboratorijų susitarimą ir galimybę patikrinti, ar visos jos iš tikrųjų laikosi tų pačių taisyklių.
Šis pasiūlymas primena ginklų kontrolės logiką, bet DI atveju verifikacija būtų sudėtingesnė. Mokymo procesus ir eksperimentus lengviau slėpti nei raketų bazes, o skaičiavimo ištekliai ir programinė įranga gali būti naudojami labai plačiai. Todėl pats raginimas stabdyti skamba rimtai, bet praktinis tokio susitarimo įgyvendinimas kol kas lieka labiau politinis ir techninis klausimas nei parengtas planas.
Sensacingos antraštės slepia svarbų niuansą: Claude dar nėra savarankiškai save kurianti sistema
Šioje istorijoje lengva nuslysti į apokaliptinį toną, bet faktai rodo siauresnį vaizdą. Claude jau labai stipriai spartina programavimo ir tyrimų procesus „Anthropic“ viduje, tačiau pati bendrovė pripažįsta, kad modeliai dar nėra pasiekę visiško rekursyvaus savęs tobulinimo. Jie padeda kurti DI, bet dar nėra pilnai savarankiška DI kūrimo grandinė.
Kritikai, tarp jų DI tyrėjas Gary Marcusas, teigia, kad „Anthropic“ perspėjimas gali būti perspaustas, nes pateikti duomenys pirmiausia rodo labai efektyvų kodo rašymo automatizavimą, o ne tikrą bendrojo intelekto ar visiškos savikūros atsiradimą. Jo vertinimu, rekursyvus savęs tobulinimas šiuo atveju neturėtų būti painiojamas su situacija, kurioje mašina jau gali autonomiškai atlikti viską, ką gali žmogus.
Tačiau net skeptiškai vertinant „Anthropic“ toną, pati kryptis yra svarbi. Kai viena pažangiausių DI bendrovių pripažįsta, kad daugiau kaip 80 proc. jos gamybinio kodo jau rašo modelis, klausimas nebėra, ar DI keičia programavimą. Klausimas kitas: kada žmogaus vaidmuo iš kūrėjo virs prižiūrėtoju, o kada prižiūrėtojas taps per lėtas sistemai, kuri mokosi ir kuria greičiau, nei institucijos geba suprasti, ką ji daro.
Šaltiniai
The Independent. (2026). Anthropic says new trend could see ‘humans losing control over AI systems’
https://www.independent.co.uk/bulletin/news/claude-anthropic-code-ai-model-control-b2990416.html
Anthropic. (2026). When AI builds itself
https://www.anthropic.com/institute/recursive-self-improvement
Reuters. (2026). Anthropic says AI labs need coordinated plan to halt development if risks rise
https://www.reuters.com/business/anthropic-says-ai-labs-need-coordinated-plan-halt-development-if-risks-rise-2026-06-04/
Anthropic. (2025). Agentic Misalignment: How LLMs could be insider threats
https://www.anthropic.com/research/agentic-misalignment
Gary Marcus. (2026). No need to panic about Anthropic’s new blog
https://garymarcus.substack.com/p/no-need-to-panic-about-anthropics
DAO narių vertinimas
Straipsnio publikavimą patvirtino 4 iš 5 priskirtų DAO narių
Straipsnis aiškiai ir suprantamai pateikia aktualią informaciją apie dirbtinio intelekto raidos tendencijas, kas yra svarbu tiek specialistams, tiek plačiajai visuomenei. Jame pateikiami konkretūs pavyzdžiai ir skaičiai, kurie padeda geriau suprasti temą.
Straipsnis pateikia tikslią informaciją apie DI kūrimo procesus ir bendrovės 'Anthropic' teiginius, remiasi patikimais šaltiniais ir vengia dezinformacijos. Jame aiškiai nurodoma, kad pateikti skaičiai yra bendrovės vidiniai vertinimai, kas padeda išvengti manipuliacijos.
Straipsnis yra aktualus, nes nagrinėja DI kūrimo tendencijas ir rizikas, kurios yra svarbios tiek technologijų specialistams, tiek plačiajai visuomenei. Informacija apie Claude modelio pažangą ir jo poveikį kodo rašymui yra reikšminga šiuolaikinėje DI diskusijoje.
Straipsnis pateikia svarbią informaciją apie DI kūrimo pažangą ir galimas rizikas, susijusias su savęs tobulinimu, kas yra aktualu visuomenei. Jame analizuojama, kaip DI gali paveikti darbo procesus ir kontrolę, todėl jis yra konstruktyvus ir naudingas skaitytojams.
Straipsnyje yra akcentuojama galimybė prarasti kontrolę DI sistemoms, kas gali sukelti nepagrįstą nerimą. Nors pateikiama informacija apie DI pažangą, tonas gali būti interpretuojamas kaip emocinė manipuliacija, skatinanti baimę dėl ateities.