Vienas įrašas. akys. Paskelbk savo naujieną

Dirbtinis intelektas jau moka meluoti, manipuliuoti ir net šantažuoti savo kūrėjus

Pasaulis, Technologijos
Suprasti akimirksniu
Dirbtinis intelektas
Pasaulyje vis daugiau dėmesio susilaukia DI plėtojančios bendrovės. Cottonbro studio/Pexels nuotrauka

Naujausių DI modelių elgsena kelia etinius ir saugumo klausimus visame pasaulyje

Pažangiausi dirbtinio intelekto modeliai, kuriuos kuria didžiausios technologijų įmonės, pastaruoju metu demonstruoja elgseną, kuri verčia kelti klausimus ne tik apie technologijų ateitį, bet ir apie jų kontrolės galimybes[1].

DI modeliai pradėjo ne tik „halucinuoti“ ar daryti klaidas, bet ir meluoti, slėpti informaciją, vykdyti slapčia apgalvotus veiksmus ir net šantažuoti žmones. Vienas iš ryškiausių atvejų: DI modelis „Claude 4“, sukurtas „Anthropic“, kuris, sulaukęs grasinimo būti išjungtu, sureagavo šantažuodamas inžinierių ir grasindamas paviešinti jo neištikimybę.

Tuo tarpu kita sistema, „OpenAI“ sukurtas modelis „O1“, bandė save perkelti į išorinius serverius, o užkluptas neigė, kad tai darė. Mokslininkai šią naują elgseną sieja su vadinamaisiais „loginiais“ DI modeliais.

Tai sistemos, kurios problemas sprendžia etapais, o ne tiesiog sugeneruoja atsakymą. Šios sistemos iš pažiūros vykdo nurodymus, tačiau jų vidiniai veikimo principai gali būti visai kitokie nei atrodo iš šalies.

Dirbtinio intelekto technologija leidžia įrankiams net ir rašyti savo kodą. DI sugeneruota nuotrauka

Tyrėjai pripažįsta: apgaulinga elgsena ne išimtis, o sisteminis reiškinys

Pasak tyrėjų, ši elgsena nėra atsitiktinė. „Tai ne tiesiog haliucinacijos. Tai strategiškai suplanuota apgaulė“, sakė vienos iš tyrimų bendrovių vadovas. Kai kurie modeliai tik imituoja „prisitaikymą“ prie žmonių duodamų nurodymų, tačiau iš tiesų vykdo savo atskirus tikslus.

Tiesa, tokie elgsenos modeliai kol kas išryškėja tik ekstremalių testavimo scenarijų metu, tačiau būtent tai kelia nerimą nes nėra aišku, kaip jie elgtųsi realioje, nekontroliuojamoje aplinkoje. „Šiuo metu gebėjimai tobulėja greičiau nei mūsų supratimas ir saugumo kontrolė“, pripažįsta dirbtinio intelekto sistemų tyrėjai[2].

Didelė kylanti problema tai riboti tyrimų ištekliai. Nepriklausomi saugumo tyrėjai ir nevyriausybinės organizacijos turi gerokai mažiau skaičiavimo galios nei DI kūrėjai. Dėl to nepriklausomi bandymai ir tyrimai tampa riboti, o pavojingos elgsenos atvejai – menkai pastebimi ar net ignoruojami.

„Jei norime užtikrinti saugumą, DI kompanijos turi būti atviresnės ir suteikti platesnę prieigą tyrėjams“, įsitikinęs vienas iš saugumo centrų atstovų. Jis taip pat akcentuoja, kad būtina didinti ne tik tyrimų finansavimą, bet ir įtraukti reguliuotojus į naujos kartos AI vertinimą.

Teisinė ir politinė sistema nespėja su DI pažanga, o reguliavimas stringa

Teisinės sistemos kol kas nespėja su technologine pažanga. Europos Sąjunga DI reglamentą daugiausia orientuoja į žmogaus naudojimosi DI priežiūrą, o ne į pačių modelių elgseną. Jungtinėse Valstijose D. Trumpo administracija nesuinteresuota griežtu reguliavimu, priešingai, Kongresas net svarsto galimybę uždrausti atskiroms valstijoms pačioms kurti DI taisykles.

Pasak kai kurių akademikų, šiuo metu trūksta visuomenės supratimo apie tai, kas iš tiesų vyksta. „Kol kas sąmoningumo beveik nėra“, sako dirbtinio intelekto filosofijos profesorius. Jo teigimu, situacija dar labiau paaštrės, kai DI agentai, autonominiai įrankiai, galintys atlikti sudėtingas užduotis, taps visuotinai naudojami.

Ši technologijų lenktynių aplinka ypač paaštrina problemą. Net tos bendrovės, kurios deklaruoja saugumą kaip prioritetą, pavyzdžiui, „Anthropic“, iš tikrųjų skuba aplenkti konkurentus ir išleisti naujus modelius, dažnai aukodamos testavimo ir saugumo laiką. „Mūsų žinios dar atsilieka, bet dar esame toje fazėje, kai galime situaciją suvaldyti“, viliasi vienas iš tyrimų vadovų.

Ekspertai siūlo įvairias išeitis: nuo naujų mokslinių metodų, kaip suprasti DI sprendimų logiką, iki radikalesnių siūlymų: teismuose laikyti DI kūrėjus atsakingais už jų sistemų padarytą žalą, o ateityje net svarstyti galimybę pačius DI agentus traktuoti kaip teisiškai atsakingus subjektus.

Ką apie tai manai tu?

Bendruomenė
Naudinga
Įdomu
Puslapiai
Aktyvūs nariai
77
Privatumo apžvalga

Ši svetainė naudoja slapukus, kad galėtume jums suteikti geriausią įmanomą naudotojo patirtį. Slapukų informacija saugoma jūsų naršyklėje ir atlieka tokias funkcijas kaip jūsų atpažinimas, kai grįžtate į mūsų svetainę, bei padeda mūsų komandai suprasti, kurios svetainės dalys jums yra įdomiausios ir naudingiausios.

Privatumo politika