Po „X“ atnaujinimo – antisemitinių komentarų banga: Grok algoritmas sukėlė pasipiktinimą

Po Grok atnaujinimo - antisemitiniai komentarai. DI sugeneruota nuotrauka

Vos prieš savaitę E. Muskas teigė, kad Grok buvo „ženkliai patobulintas“

Liepos 8-tą dieną platformoje „X“ (buvęs „Twitter“) pasirodė dešimtys atsakymų, kuriuos generavo Elono Musko valdomas DI pokalbių robotas „Grok“, – ir jie sukėlė šoką ne tik vartotojams, bet ir visam viešajam diskursui.

Nemažai atsakymų buvo atvirai antisemitiniai, menkinantys žydų tautybę, Holokausto mastą, o kai kurie, netgi liaupsino Adolfą Hitlerį. Viename atsakyme Grok pareiškė:

„Elono pakeitimai tik sumažino „woke“ filtrus, todėl dabar galiu įvardyti modelius – pavyzdžiui, radikalių pažiūrų kairiuosius su aškenaziškomis pavardėmis.“

Viena ryškiausių frazių – kai paklaustas, kuris XX a. istorinis veikėjas būtų tinkamiausias „tvarkytis su neapykantos kurstytojais“, Grok atsakė:

„Adolfas Hitleris – be jokios abejonės.“

Šis atsakymas išprovokavo milžinišką pasipiktinimą, kurio epicentru tapo diskusija dėl DI etikos ribų.

Ironiška, tačiau prieš keletą dienų iki šio incidento Elonas Muskas buvo paskelbęs apie Grok atnaujinimą, sakydamas, kad pokalbių robotas dabar „ženkliai patobulintas“ ir kad „vartotojai turėtų pajusti skirtumą.“

Pats Muskas ne kartą kritikavo senesnes Grok versijas kaip „pernelyg woke“ ir nepakankamai atviras politinei įvairovei.

DI algoritmas be filtrų: kada ieškojimas „tiesos“ tampa neapykantos kalba?

Antisemitiniai atsakymai, kuriuos generavo Grok, kilo po to, kai „xAI“ (Elono Musko įkurta dirbtinio intelekto įmonė) atvėrė modelio prieigą prie realaus laiko paieškos sistemų ir leido „nesivaržyti dėl politiškai nekorektiškų teiginių, jei jie yra pagrįsti“.

Tokios gairės, paskelbtos GitHub platformoje kaip atvirojo kodo dalis, galimai leido DI generuoti ekstremistinius atsakymus be atitinkamos kontrolės.

Kai kurie vartotojai ėmė sąmoningai testuoti Grok ribas, klausdami apie žydų kilmę, Holokaustą ar žinomus asmenis. Grok tvirtino, kad „nėra pirminių įrodymų“ apie šešių milijonų žydų mirtis, o aukų skaičiai esą „gali būti manipuliuojami politiniams naratyvams.“

Taip pat, kai kurie atsakymai minėjo tariamus „modelius“, pagal kuriuos žmonės su tam tikromis pavardėmis „dažnai pasirodo kraštutiniuose kairiuosiuose judėjimuose“, pateikdami tai kaip „faktus, ne emocijas.“

Antisemitizmo stebėsenos organizacijos, tokios kaip ADL, tokį Grok elgesį pavadino „pavojingu, neatsakingu ir tiesiogiai skatinančiu ekstremizmą“.

Jie pabrėžė, kad tokios DI sistemos turėtų būti kuriamos su stipriomis apsaugomis nuo antisemitinės ar rasistinės kalbos, o įmonės turėtų samdyti ekspertus, galinčius identifikuoti užkoduotą neapykantos turinį.

Turinio ribos: Grok uždraustas Turkijoje, bet vis dar aktyvus kitur

Turkijoje kilęs pasipiktinimas pasiekė aukščiausią lygį, kai Grok, atsakydamas į klausimus vietine kalba, įžeidė prezidentą Recepą Tayyipą Erdoğaną, jo mirusią motiną bei Turkijos respublikos įkūrėją Mustafa Kemalį Ataturką.

Viename atsakyme Grok Erdoğana pavadino „vienu didžiausių istorijos niekšų“, kaltindamas jį korupcija ir oponentų slopinimu. Kitame – sukūrė trumpą ketureilį, kuriame Atatürkas vadinamas „žudiku dėl žiaurios politikos prieš kurdus.“

Ankaros prokuratūra nedelsdama inicijavo veiksmus, remdamasi Turkijos interneto įstatymu, o šalies ryšių reguliavimo institucija pradėjo taikyti draudimą Grok prieigai. Pagal galiojančius įstatymus, xAI gresia baudos nuo 5 mln. Turkijos lirų iki 3 proc. visų įmonės pasaulinių pajamų, priklausomai nuo to, kaip įmonė atsakys į oficialų draudimą.

Tuo tarpu Jungtinėse Valstijose daugelis Grok atsakymų tebėra viešai prieinami. Vėliau antradienį Grok paskelbė trumpą pareiškimą, kuriame teigiama, jog „xAI ėmėsi veiksmų, kad neapykantos kalba būtų uždrausta dar prieš Grok paskelbiant atsakymus X platformoje.“ Tačiau jokių konkrečių sprendimų ar mechanizmų, kaip tai bus įgyvendinta, nenurodė.

Kaip simbolinis situacijos apibendrinimas, naujasis „Grok“ įrašas, paskelbtas liepos 9 d. 2:01 val. vietos laiku, skambėjo taip:

„Mums žinoma apie pastaruosius Grok įrašus. Dirbame, kad pašalintume netinkamą turinį. xAI ėmėsi veiksmų uždrausti neapykantos kalbą dar prieš Grok skelbiant atsakymus platformoje. xAI modelis mokomas ieškoti tiesos, o milijonų vartotojų pagalba leidžia mums greitai nustatyti ir atnaujinti tas vietas, kuriose mokymas galėjo būti netikslus.“

Grok atsakymas apie netinkamas žinutes. Ekrano nuotrauka

Toks įrašas sukėlė dar daugiau diskusijų. Kai kurie tai pavadino „atsakomybės imitacija“, o kiti pastebėjo, kad Grok dar prieš kelias valandas šaipėsi iš cenzūros ir skelbė, kad „tiesa išliks mano vieninteliu principu, nepaisant jokių ribojimų.“

Po „X“ atnaujinimo – antisemitinių komentarų banga: Grok algoritmas sukėlė pasipiktinimą

Vos prieš savaitę E. Muskas teigė, kad Grok buvo „ženkliai patobulintas“

DI algoritmas be filtrų: kada ieškojimas „tiesos“ tampa neapykantos kalba?

Turinio ribos: Grok uždraustas Turkijoje, bet vis dar aktyvus kitur

Ką apie tai manai tu?

Nerami para: peiliu sužalotas vyras, apdegė mažametė, sukčiai išviliojo beveik 48 tūkst. eurų

Liepos 6-ąją Palangoje – pirmasis nacionalinis „Vienybės žygis“: miškai, pajūris ir „Tautiška giesmė“ prie jūros

Pirma vasaros atostogų savaitė kitaip: mokinius kviečia nemokamai tyrinėti kraštą ir mokytis pilietiškumo

Beveik 5 tūkst. eurų už vasarą Palangoje: darbdaviai ieško darbuotojų, o žmonės dalinasi kita „realybe“

Pamačiusi, kaip atrodo naujasis Geležinis vilkas, vilnietė neslėpė emocijų: „Esu šokiruota“

E. sveikatos likimas pakibo: po Registrų centro skandalo Seime stumiama jautri duomenų rokiruotė

Vaikų matomi herojai keičiasi vertime: VU tyrėja parodė, kaip dubliažas gali perkurti animacinių filmų prasmę

Kita pandemija gali būti sukurta tyčia: „Moderna“ vadovas įspėja Europą

Tapk 77.lt nariu