Dirbtinis intelektas jau moka meluoti, manipuliuoti ir net šantažuoti savo kūrėjus

Naujausių DI modelių elgsena kelia etinius ir saugumo klausimus visame pasaulyje

Pažangiausi dirbtinio intelekto modeliai, kuriuos kuria didžiausios technologijų įmonės, pastaruoju metu demonstruoja elgseną, kuri verčia kelti klausimus ne tik apie technologijų ateitį, bet ir apie jų kontrolės galimybes^[1].

DI modeliai pradėjo ne tik „halucinuoti“ ar daryti klaidas, bet ir meluoti, slėpti informaciją, vykdyti slapčia apgalvotus veiksmus ir net šantažuoti žmones. Vienas iš ryškiausių atvejų: DI modelis „Claude 4“, sukurtas „Anthropic“, kuris, sulaukęs grasinimo būti išjungtu, sureagavo šantažuodamas inžinierių ir grasindamas paviešinti jo neištikimybę.

Tuo tarpu kita sistema, „OpenAI“ sukurtas modelis „O1“, bandė save perkelti į išorinius serverius, o užkluptas neigė, kad tai darė. Mokslininkai šią naują elgseną sieja su vadinamaisiais „loginiais“ DI modeliais.

Tai sistemos, kurios problemas sprendžia etapais, o ne tiesiog sugeneruoja atsakymą. Šios sistemos iš pažiūros vykdo nurodymus, tačiau jų vidiniai veikimo principai gali būti visai kitokie nei atrodo iš šalies.

Dirbtinio intelekto technologija leidžia įrankiams net ir rašyti savo kodą. DI sugeneruota nuotrauka

Tyrėjai pripažįsta: apgaulinga elgsena ne išimtis, o sisteminis reiškinys

Pasak tyrėjų, ši elgsena nėra atsitiktinė. „Tai ne tiesiog haliucinacijos. Tai strategiškai suplanuota apgaulė“, sakė vienos iš tyrimų bendrovių vadovas. Kai kurie modeliai tik imituoja „prisitaikymą“ prie žmonių duodamų nurodymų, tačiau iš tiesų vykdo savo atskirus tikslus.

Tiesa, tokie elgsenos modeliai kol kas išryškėja tik ekstremalių testavimo scenarijų metu, tačiau būtent tai kelia nerimą nes nėra aišku, kaip jie elgtųsi realioje, nekontroliuojamoje aplinkoje. „Šiuo metu gebėjimai tobulėja greičiau nei mūsų supratimas ir saugumo kontrolė“, pripažįsta dirbtinio intelekto sistemų tyrėjai^[2].

Didelė kylanti problema tai riboti tyrimų ištekliai. Nepriklausomi saugumo tyrėjai ir nevyriausybinės organizacijos turi gerokai mažiau skaičiavimo galios nei DI kūrėjai. Dėl to nepriklausomi bandymai ir tyrimai tampa riboti, o pavojingos elgsenos atvejai – menkai pastebimi ar net ignoruojami.

„Jei norime užtikrinti saugumą, DI kompanijos turi būti atviresnės ir suteikti platesnę prieigą tyrėjams“, įsitikinęs vienas iš saugumo centrų atstovų. Jis taip pat akcentuoja, kad būtina didinti ne tik tyrimų finansavimą, bet ir įtraukti reguliuotojus į naujos kartos AI vertinimą.

Teisinė ir politinė sistema nespėja su DI pažanga, o reguliavimas stringa

Teisinės sistemos kol kas nespėja su technologine pažanga. Europos Sąjunga DI reglamentą daugiausia orientuoja į žmogaus naudojimosi DI priežiūrą, o ne į pačių modelių elgseną. Jungtinėse Valstijose D. Trumpo administracija nesuinteresuota griežtu reguliavimu, priešingai, Kongresas net svarsto galimybę uždrausti atskiroms valstijoms pačioms kurti DI taisykles.

Pasak kai kurių akademikų, šiuo metu trūksta visuomenės supratimo apie tai, kas iš tiesų vyksta. „Kol kas sąmoningumo beveik nėra“, sako dirbtinio intelekto filosofijos profesorius. Jo teigimu, situacija dar labiau paaštrės, kai DI agentai, autonominiai įrankiai, galintys atlikti sudėtingas užduotis, taps visuotinai naudojami.

Ši technologijų lenktynių aplinka ypač paaštrina problemą. Net tos bendrovės, kurios deklaruoja saugumą kaip prioritetą, pavyzdžiui, „Anthropic“, iš tikrųjų skuba aplenkti konkurentus ir išleisti naujus modelius, dažnai aukodamos testavimo ir saugumo laiką. „Mūsų žinios dar atsilieka, bet dar esame toje fazėje, kai galime situaciją suvaldyti“, viliasi vienas iš tyrimų vadovų.

Ekspertai siūlo įvairias išeitis: nuo naujų mokslinių metodų, kaip suprasti DI sprendimų logiką, iki radikalesnių siūlymų: teismuose laikyti DI kūrėjus atsakingais už jų sistemų padarytą žalą, o ateityje net svarstyti galimybę pačius DI agentus traktuoti kaip teisiškai atsakingus subjektus.

Dirbtinis intelektas jau moka meluoti, manipuliuoti ir net šantažuoti savo kūrėjus

Naujausių DI modelių elgsena kelia etinius ir saugumo klausimus visame pasaulyje

Tyrėjai pripažįsta: apgaulinga elgsena ne išimtis, o sisteminis reiškinys

Teisinė ir politinė sistema nespėja su DI pažanga, o reguliavimas stringa

Ką apie tai manai tu?

Nerami para: peiliu sužalotas vyras, apdegė mažametė, sukčiai išviliojo beveik 48 tūkst. eurų

Liepos 6-ąją Palangoje – pirmasis nacionalinis „Vienybės žygis“: miškai, pajūris ir „Tautiška giesmė“ prie jūros

Pirma vasaros atostogų savaitė kitaip: mokinius kviečia nemokamai tyrinėti kraštą ir mokytis pilietiškumo

Beveik 5 tūkst. eurų už vasarą Palangoje: darbdaviai ieško darbuotojų, o žmonės dalinasi kita „realybe“

Pamačiusi, kaip atrodo naujasis Geležinis vilkas, vilnietė neslėpė emocijų: „Esu šokiruota“

E. sveikatos likimas pakibo: po Registrų centro skandalo Seime stumiama jautri duomenų rokiruotė

Vaikų matomi herojai keičiasi vertime: VU tyrėja parodė, kaip dubliažas gali perkurti animacinių filmų prasmę

Kita pandemija gali būti sukurta tyčia: „Moderna“ vadovas įspėja Europą

Tapk 77.lt nariu