Suprasti akimirksniu
  • „Stable Diffusion“ gali skaityti mūsų mintis ir paversti jas paveikslėliais
  • Bandymai sudėtingi, tačiau daug žadantys
  • DI bandymai su žmogaus smegenimis nėra naujiena
  • „Stable Diffusion“ susiduria su teisiniais nemalonumais
Šaltiniai
Dirbtinis intelektas
„Stable Diffusion“ gali skaityti mūsų mintis ir paversti jas paveikslėliais. Jake'o Walkerio/Unsplash nuotrauka

„Stable Diffusion“ gali skaityti mūsų mintis ir paversti jas paveikslėliais

Pastaruoju metu pastebima tikra dirbtinio intelekto (DI) technologijų tobulėjimo tendencija. Viena nauja technologija keičia kitą, o jų sugebėjimai vis labiau stebina. Jei vos prieš kelias savaites socialinės žiniasklaidos platformos netilo „Chat GPT“ galimybių tema, dabar vis garsiau kalbama ir apie kitos DI programos – „Stable Diffusion“ – pajėgumus.

O nustebinti gali ne tik tai, kad programa pagal tekstinius aprašymus gali sugeneruoti vaizdus, tačiau ir tai, kad mokslininkai gali pasitelkti programą ypač ambicingiems smegenų tyrimams. Neseniai paskelbta, kad mokslininkams pavyko pasitelkti DI programos „Stable Diffusion“ modelį ir atkurti stebėtinai tikslius vaizdus iš žmogaus atminties.

Japonijos mokslininkai Yu Takagi ir Shinji Nishimoto iš Osakos universiteto biologijos mokslų aukštosios mokyklos paskelbė savo išvadas ataskaitoje, kuri dar nebuvo nepriklausomai recenzuota. Tačiau toks bandymas, kai DI nuskaito žmogaus smegenų bangas ir puikiai atvaizduoja įsimintinus vaizdinius, iš tiesų gali tapti tikra revoliucija[1].

DI pagalba sukonstruoti vaizdai. Tviterio ekrano nuotrauka 2023-03-07
DI pagalba sukonstruoti vaizdai. Tviterio ekrano nuotrauka 2023-03-07

Bandymai sudėtingi, tačiau daug žadantys

Nors net keliuose ankstesniuose skirtingų šalių ir aukštųjų mokyklų komandų atliktuose tyrimuose DI pagalba jau buvo gautos didelės skiriamosios raiškos žmogaus minčių vaizdo rekonstrukcijos, tokie rezultatai buvo pasiekti tik po specialių DI technologijos apmokymų.

Tačiau Osakos universiteto mokslininkai teigia, kad būtent jie pirmą kartą numatė latentinį atvaizdavimą pagal vaizdo duomenų modelį, remiantis funkcinio magnetinio rezonanso signalais. Galiausiai tyrėjai iššifravo vaizdus iš šių signalų ir panaudojo juos kaip esminius duomenis galutiniam DI sukonstruotam vaizdui sukurti.

Japonijos mokslininkų komanda teigia, kad tarp tiriamųjų yra akivaizdžių tikslumo skirtumų ir galimų klaidų, tačiau jie koreliuoja su pačia funkcinio magnetinio rezonanso duomenų vaizdo kokybe. Tyrėjų teigimu, rekonstrukcijų kokybė prilygsta geriausiems dabartiniams moksle prieinamiems metodams, o svarbiausia, kad DI technologijos net nereikia apmokyti papildomai.

DI bandymai su žmogaus smegenimis nėra naujiena

Mokslininkai jau ne vienerius metus siekia pasitelkti DI galimybes plačiau atliekant žmogaus smegenų tyrimus arba plėtojant sąsajas su mūsų smegenimis bei DI.

Pavyzdžiui, 2014 m. Šanchajuje gyvenanti menininkė Jody Xiong, naudodama elektroencefalografijos biojutiklius sujungė juos su dažų pripildytais balionais: tai sergantiems žmonėms leido tiesiog minčių pagalba susprogdinti balionus ir taip sukurti savitus piešinius.

Kiek vėliau menininkė Lia Chavez sukūrė instaliaciją, kurioje elektros impulsai iš smegenų leido sukurti garso ir šviesos kūrinius bei instaliacijas.

2018 m. grupė tyrėjų iš Japonijos pademonstravo, kaip pasitelkus DI galima atkurti vaizdus iš funkcinio magnetinio rezonanso įrašų. 2019 m. kita grupė tyrėjų DI pagalba rekonstravo vaizdus iš beždžionių siunčiamų smegenų signalų[2].

2022 m. grupė iš Teksaso universiteto Ostine parodė, kad DI modeliai iš funkcinio magnetinio rezonanso skenavimo duomenų gali išvesti tekstą, apibūdinantį semantinį turinį, kurį tiriamas asmuo matė vaizdo įraše.

Vienas paskutinių proveržių fiksuotas tuomet, kai Singapūro nacionalinio universiteto, Kinijos Honkongo universiteto ir Stanfordo universiteto mokslininkai, naudodami „MinD-Vis“, pademonstravo, kaip „Stable Diffusion“, „DALL-E“ ir „Midjourney“ technologijos gali rekonstruoti žmogaus smegenų užfiksuotus vaizdus.

DI gali skaityti mūsų mintis. Christopher Gower/Unsplash nuotrauka
DI gali skaityti mūsų mintis. Christopher Gower/Unsplash nuotrauka

„Stable Diffusion“ susiduria su teisiniais nemalonumais

Tačiau nepaisant didelių ambicijų technologijų srityje „Stable Diffusion“ susiduria ir su nemalonumais. JAV ir Jungtinės Karalystės vizualinės žiniasklaidos įmonė „Getty Images“ neseniai pateikė ieškinį teismui dėl dirbtinio intelekto bendrovės „Stability AI“, kaltindama ją be specialaus leidimo panaudojus daugiau kaip 12 milijonų nuotraukų.

Šie vaizdiniai buvo naudojami „Stability AI“ sukurtam dirbtinio intelekto vaizdų generatoriui „Stable Diffusion“ apmokyti[3].

Ieškinys pateiktas Delavero federaliniam teismui. Jame „Getty Images“ atstovai teigia, kad „Stability AI“ nukopijavo bendrovės nuotraukas, jų pavadinimus ir metaduomenis taip „stengiantis sukurti konkuruojantį verslo modelį“. Ieškinyje taip pat teigiama, kad „Stability AI“ pašalino arba pakeitė „Getty Images“ autorių teisių valdymo informaciją.

Pretenzijos bendrovei „Stability AI“ apima ne tik autorių teisių pažeidimą, bet ir kitų kompanijų autorių teisių pažeidimą, nesąžiningą konkurenciją ir apgaulingą prekybos praktiką.

„Getty Images“ advokatai prašo sušaukti prisiekusiųjų teismą ir reikalauja įstatyminės žalos atlyginimo iki 150 000 JAV dolerių už kiekvieną pažeistą kūrinį.

„Stability AI“ su savo „Stable Diffusion“ iš tiesų tiesiogiai konkuruoja su „Getty Images“, o dalis technologijų ekspertų sutinka, kad prie „Stability AI“ sėkmės prisidėjo būtent „Getty Images“ vaizdų katalogas.

Negana to, „Stability AI“ papildomai pelnosi iš savo konkurento, nes neteisėtai naudojamus „Getty Images“ vaizdinius siūlo ir atvirojo kodo versijose trečiųjų šalių kūrėjams.

„Tos trečiosios šalys gauna naudos iš „Stability AI“ daromo „Getty Images“ pažeidimo, o „Stability AI“ savo ruožtu gauna naudos iš plačiai paplitusio savo modelio pritaikymo“, – teigiama „Getty Images“ pranešime.