Pasipiktinimas DI: „OpenAI“ ir „Meta“ kaltinamos autorių teisių negerbimu

Pasaulis, TechnologijosDovilė Barauskaitė
Suprasti akimirksniu
Pasipiktinimas DI
Dirbtinio intelekto modeliai kaltinami neteisėta veikla. Sanket Mishra/ Pexels nuotrauka

Komikė Sarah Silverman teigia, kad „OpenAI“ dirtinio intelekto įrankių kūrėjai pažeidė plagiato įstatymus

Dirbtinio intelekto (DI) atsiradimas neabejotinai sukėlė revoliuciją šiuolaikiniame pasaulyje. Nuo išmaniųjų asistentų iki sudėtingų prognozavimo modelių, dirbtinio intelekto įrankiai įsiskverbė į beveik kiekvieną mūsų gyvenimo aspektą. Šią revoliuciją įkūnija pirmaujanti dirbtinio intelekto srityje bendrovė „OpenAI“ su savo novatoriškais kalbos modeliais, tokiais kaip „Chat GPT-4“. Tačiau ši technologinė pažanga neapsieina be prieštaravimų.

„OpenAI“ ir kitos dirbtinio intelekto bendrovės bei jų priemonės sukėlė nemažai sumaišties, prieštaringai įžengė į pasaulį ir sukėlė chaoso jausmą. Pagrindinis nesutarimų objektas tai metodas, kurį šie dirbtinio intelekto modeliai naudoja mokytis ir kurti į žmogų panašų tekstą. Šie modeliai, naudojantys didžiulius duomenų kiekius, sukėlė abejonių ir teisinių klausimų dėl privatumo ir autorių teisių pažeidimo[1].

Neabejotina, kad dirbtinio intelekto priemonių integravimas į mūsų visuomenę buvo audringas ir kupinas ginčų: nuo kritikų, teigiančių, kad duomenys naudojami netinkamai ir pažeidžiamos autorių teisės, iki šalininkų, ginančių dirbtinio intelekto teikiamą technologinę pažangą. Įžengus į šią naują erą, pokalbiai toliau plėtojami, verčiant mus iš naujo apibrėžti ir kvestionuoti patį kūrybos, nuosavybės ir teisių pobūdį dirbtinio intelekto amžiuje.

Autoriai kaltina neteisėtu medžiagos su autorinėmis teisėmis, naudojimu

Ginčas pasiekė aukščiausią tašką, kai žinoma komikė Sarah Silverman kartu su autoriais Christopheriu Goldenu ir Richardu Kadrey padavė į teismą bendroves „OpenAI“ ir „Meta“ už tai, kad jos tariamai be jų sutikimo mokė savo kalbos modelius naudodamos autorių teisių saugomą medžiagą[2]. Šie ieškiniai sudrumstė vandenis, išryškindami platesnes etines ir teisines dirbtinio intelekto mokymo metodikų pasekmes, kartu sukeldami aršias diskusijas apie kūrėjų teises dirbtinio intelekto eroje.

Bendrovės paduotis į teismą
„OpenAI“ ir „Meta“ kaltinamos pažeidimais ir autorių medžiagos vagyste. Matheus Bertelli/ Pexels nuotrauka

Šis, dabar jau viešas, ginčas konkrečiai kyla dėl duomenų rinkinių, kuriuos bendrovės „OpenAI“ ir „Meta“ naudojo savo dideliems kalbos modeliams, t. y. „ChatGPT“ ir „LLaMA“, mokyti. Ieškovams atstovaujantys teisininkai teigia, kad bendrovės duomenų rinkinys yra gerokai didesnis nei autorių teisėmis neapsaugota „Project Gutenberg“ duomenų bazė, o tai leidžia manyti, kad į jį greičiausiai įtraukta autorių teisėmis saugoma medžiaga iš vadinamųjų šešėlinių bibliotekų, tokių kaip „Library Genesis“ ir „Sci-Hub“.

Šios platformos kaltinamos neteisėtai teikiančios autorių teisėmis saugomą medžiagą. Ypač įtikinamu S. Silverman bylos įrodymu tapo komikės advokatų pateikta sąveika su „ChatGPT“, kurioje ji ne tik galėjo pateikti išsamią 2010 m. S. Silverman memuarų knygos santrauką, bet netgi pažodžiui atkurti kai kurias ištraukas.

Šie ieškiniai nėra pavieniai atvejai. Kompanija „OpenAI“ jau anksčiau yra sulaukusi panašių kaltinimų, įskaitant birželio mėn. pateiktą didelės apimties grupinį ieškinį, kuriame teigiama, kad technologijų įmonė pažeidė federalinius ir valstijų privatumo įstatymus, nes naudojo nuskaitytus duomenis, skirtus dirbtinio intelekto modeliams kaip „ChatGPT“ ir „DALLE“ apmokyti[3].

Kaltinimai „akivaizdžiai neteisėta“ veikla apmokant DI modelius

Po šių kaltinimų advokatų kontora atstovaujanti komikę ir kitus autorius, jų vardu pateikė federalinius grupinius ieškinius prieš „OpenAI“ ir „Meta“. Anksčiau ši advokatų kontora yra padavusi į teismą „GitHub“ dėl kaltinimų autorių teisių pažeidimu, susijusiu su generatyviniu dirbtiniu intelektu. Šie ieškiniai vis dar keliauja į teismą[4].

Pranešime spaudai advokatų kontora apibūdino dirbtinio intelekto įrankius kaip pramoninio lygio plagiatorius, pažeidžiančius autorių teises. Jų teigimu, nuo 2023 m. kovo mėn. keli autoriai ir leidėjai išreiškė susirūpinimą dėl šių dirbtinio intelekto įrankių keisto gebėjimo generuoti tekstą, panašų į autorių teisėmis saugomą turinį.

Naujausi ieškiniai, kuriuose reikalaujama prisiekusiųjų teismo ir nuolatinių draudimų, galinčių priversti bendroves pakeisti savo dirbtinio intelekto įrankius, buvo pateikti San Francisko JAV apygardos teismui. Abi įmonės kol kas susilaikė nuo komentarų šiuo klausimu. Advokatų agentūros atstovas pranešė, kad jei bus leista toliau elgtis taip, kaip įtariama, šie modeliai galiausiai pakeis autorius, kurių pavogti kūriniai maitina šiuos dirbtinio intelekto produktus, su kuriais jie konkuruoja. Taigi šis ieškinys yra platesnio masto kova už menininkų ir kūrėjų nuosavybės teisių išsaugojimą dirbtinio intelekto amžiuje.

Šiuos kaltinimus „OpenAI“ ir „Meta“ bendrovėms pareiškė autorių advokatai, kurie teigia, kad šių prieštaringai vertinamų duomenų rinkinių šaltinius nustatė iš užuominų oficialiuose bendrovių pareiškimuose ir mokslinių tyrimų dokumentuose. Abi bendrovės kaltinamos tuo, kad į savo mokymo duomenų rinkinius be aiškaus autorių ar leidėjų leidimo įtraukė autorių teisėmis saugomą turinį, kuris, kaip teigiama, buvo gautas iš kai kurių didžiausių elektroninių knygų piratavimo platformų.

Autorių teisės
Autorių teisių pažeidimų klausimas susijęs su DI yra aštri tema. Ketut Subiyanto/ Pexels nuotrauka

Išryškėjo gilesnės problemos su autorių teisių pažeidimais ir duomenų apsauga

Ieškinyje prieš „OpenAI“ nurodoma, kad „ChatGPT“ tikriausiai buvo apmokyta iš maždaug 294 000 knygų, tariamai atsisiųstų iš liūdnai pagarsėjusių šešėlinių bibliotekų platformų. „Meta“ prisipažino, kad „LLaMA“ mokė naudodama dalį duomenų rinkinio „ThePile“, kuris, kaip teigiama ieškinyje, apima visą „Bibliotik“, iš viso 196 640 knygų.

Be tariamo autorių teisių saugomos medžiagos gavimo iš šešėlinių bibliotekų, dirbtinio intelekto įrankio kūrėja kaltinama naudojusi ginčytiną duomenų rinkinį, vadinamą „BookCorpus“. Ieškinyje teigiama, kad jį 2015 m. parengė dirbtinio intelekto tyrimų grupė, siekdama mokyti kalbos modelius. Tyrėjai kaltinami kopijavę knygas iš svetainės „Smashwords“, kurioje talpinami nemokamai skaitomi savilaidos romanai.

Nepaisant to, kad šie romanai yra nemokami, juos vis tiek saugo autorių teisės ir jie buvo įtraukti į duomenų rinkinį be autorių sutikimo, pripažinimo ar atlygio. Nei vienos iš minimų bendrovių tyrėjų iš karto nepavyko pasiekti. Po to „Draft2Digital“ vienas vadovų, Dan Wood pakomentavo situaciją, pripažindamas, kad maždaug 7 185 unikalūs pavadinimai, kurie tuo metu buvo nemokami, buvo paimti be „Smashwords“ ar autorių žinios ar sutikimo. Bendrovė įsigijo „Smashwords“ 2022 m. kovo mėnesį. Atstovai apie tai, kad knygos buvo naudojamos komerciniais tikslais ir platinamos, sužinojo tik 2023 m. kovo mėn., o tai yra akivaizdus „Smashwords“ paslaugų teikimo sąlygų pažeidimas[5].

D. Woodas pabrėžė autorių teisių apsaugos svarbą visiems autoriams, nepriklausomai nuo to, ar jie yra tarptautiniu mastu pripažinti, ar naujai išleisti. Todėl bendrovė šiuo metu bendradarbiauja su savo teisininkų komanda, kad visapusiškai suprastų situaciją. Įskaitant tai, kas gavo prieigą prie duomenų ir kur jie buvo išplatinti ir sukurtų strategiją, kuri užtikrintų jų autorių teisių apsaugą. Jie su dideliu susidomėjimu stebi vykstančius teismo procesus prieš „OpenAI“ ir „Meta“.