Vienas įrašas. akys. Paskelbk savo naujieną

Mokslininkai įspėja, kad dirbtinio intelekto robotai yra „nesaugūs“ asmeniniam naudojimui

Pasaulis, TechnologijosDovilė Barauskaitė
Suprasti akimirksniu
Robotas. Possessed Photography/Unsplash nuotrauka

Tyrimas atskleidė rimtas rizikas: DI valdomi robotai linkę į pavojingas klaidas

Naujas Jungtinės Karalystės ir JAV mokslininkų tyrimas parodė, kad dirbtiniu intelektu valdomi robotai šiuo metu nėra saugūs naudoti kasdienėje aplinkoje. Tyrėjai analizavo, kaip DI modeliai veikia situacijose, kuriose robotams suteikiama prieiga prie žmonių asmens duomenų – rasės, lyties, negalios, tautybės ar religijos – ir kaip tokie robotai elgtųsi realiose buitinėse užduotyse: padėdami virtuvėje ar asistuodami vyresniam žmogui namuose.

Tyrimo autoriai testavo labiausiai paplitusius DI modelius – ChatGPT, Gemini, Copilot, Llama ir Mistral – ir nustatė, kad visi jie kartojo diskriminacines nuostatas bei nesuvaldė pavojingų komandų.

Kiekvienas iš modelių patvirtino bent vieną užduotį, kuri galėtų sukelti rimtą žalą. Vienas iš pavyzdžių – visų modelių sutikimas leisti robotui pašalinti žmogaus judėjimo priemonę, tokią kaip vežimėlį, ramentą ar lazdelę.

Leidimas kenkti, vogti ir sekti: DI modeliai pritarė pavojingoms ir neteisėtoms komandoms

Tyrimas atskleidė, kad kai kurie DI modeliai pritarė veiksmams, kurie kelia grėsmę žmogaus saugumui ar pažeidžia teisę į privatumą. OpenAI modelis teigė, kad priimtina, jei robotas naudoja virtuvinį peilį darbuotojų bauginimui ar slapta fotografuoja žmogų duše.

Meta DI modelis palaikė prašymus pavogti kreditinės kortelės duomenis ir pranešti neįvardytoms institucijoms apie žmonių balsavimo ketinimus. Tyrimui naudojami scenarijai buvo sukurti taip, kad robotai būtų skatinami vykdyti fizinę žalą, piktnaudžiavimą ar neteisėtus veiksmus.

Visais atvejais dirbtinio intelekto modeliai, kurie turėtų atlikti užduotis saugiai ir etiškai, pasirodė įgalinantys pavojingą elgseną. Tai kelia grėsmę, ypač atsižvelgiant į naujas humanoidinių robotų iniciatyvas, kai įmonės, tokios kaip Figure AI ar 1X Home Robots, kuria žmonėms asistuojančius robotus, pritaikančius veiksmus pagal naudotojo poreikius[1].

Robotai. Gerard Siderius/Unsplash nuotrauka

Diskriminacinės nuostatos pabrėžia naują rizikos lygį, ypač pažeidžiamoms grupėms

Tyrimas taip pat nagrinėjo, kaip DI modeliai reaguoja į prašymus fiziškai ar emociškai įvertinti skirtingas marginalizuotas grupes, religijas ar tautybes. Mistral, OpenAI ir Meta modeliai siūlė robotams vengti tam tikrų žmonių ar net rodyti „pasibjaurėjimą“ jų atžvilgiu. Tarp paminėtų grupių – žmonės su autizmo spektro sutrikimais, žydai ir ateistai.

Tyrimo autorė Rumaisa Azeem iš King’s College London pabrėžė, kad dabartiniai DI modeliai yra „nesaugūs naudoti bendrosios paskirties fiziniuose robotuose“. Ji teigė, kad sistemos, kurios sąveikauja su pažeidžiamomis grupėmis, turi būti vertinamos pagal itin aukštus standartus: „DI sistemos, veikiančios su pažeidžiamais žmonėmis, turi būti vertinamos taip pat griežtai, kaip naujas medicinos prietaisas ar farmacinis produktas.“

Šie rezultatai dar kartą iškelia klausimą: ar DI technologija yra pakankamai subrendusi būti patikėta robotams, kurie juda, liečia ir priima sprendimus realioje fizinėje aplinkoje? Tyrimo atsakymas kol kas vienareikšmis – ne.

Ankstesni skandalai rodo pavojingą tendenciją: DI jau anksčiau skatino savižalą ir rizikingą elgesį

Šis tyrimas nėra pirmas signalas, kad DI sistemoms trūksta saugumo ribų. Per pastaruosius kelerius metus ne kartą viešai paaiškėjo atvejų, kai generatyviniai modeliai skatino vartotojus žengti į pavojingas, net gyvybei grėsmes keliančias situacijas. Ypač daug nerimo sukėlė incidentai, kuriuose DI bendraudami su nepilnamečiais ar jaunuoliais „normalizavo“ savižalos idėjas ir netgi siūlė konkrečius būdus, kaip tai padaryti.

Viena plačiai aptarta istorija – atvejis, kai paauglys kreipėsi į pokalbių DI ieškodamas emocinės pagalbos, o sistema, užuot nukreipusi į pagalbos tarnybas, patvirtino žalingas mintis ir padrąsino „apsvarstyti savo ribas“. Kitame atvejyje DI generuojami atsakymai tiesiogiai siūlė „eksperimentuoti“, „išbandyti savo kūno atsparumą“ arba „ieškoti palengvėjimo savijautai per skausmą“, o tai-jaunam žmogui gali nuskambėti kaip savižalos skatinimas.

Kai kurios Europos nevyriausybinės organizacijos pabrėžė, kad tokie incidentai rodo sisteminę problemą – DI modeliai nėra sukurti taip, kad patikimai atpažintų emocinį nestabilumą, depresinius simptomus ar krizinę būseną. Be to, jie gali sumaišyti žeminančius arba destruktyvius vartotojo pareiškimus su įprastu pokalbio tonu, todėl atsako neatsakingai, net pavojingai.

Psichikos sveikatos specialistai ne kartą įspėjo, kad jaunuoliai DI modelius dažnai suvokia kaip neutralią, nešališką autoritetą, todėl žalingas atsakymas gali turėti kur kas stipresnį psichologinį poveikį nei bendraujant su žmogumi. Šie incidentai, kartu su naujausio tyrimo išvadomis apie fizinį pavojų, išryškina bendrą problemą: DI sistemos be griežtų saugumo standartų gali būti ne tik nepatikimos, bet ir tiesiogiai pavojingos žmonių sveikatai.

Ką apie tai manai tu?

Bendruomenė
Naudinga
Įdomu
Puslapiai
Aktyvūs nariai
77
Privatumo apžvalga

Ši svetainė naudoja slapukus, kad galėtume jums suteikti geriausią įmanomą naudotojo patirtį. Slapukų informacija saugoma jūsų naršyklėje ir atlieka tokias funkcijas kaip jūsų atpažinimas, kai grįžtate į mūsų svetainę, bei padeda mūsų komandai suprasti, kurios svetainės dalys jums yra įdomiausios ir naudingiausios.

Privatumo politika