Suprasti akimirksniu
  • DI tobulėja neįtikėtinai sparčiai ir jau gali bendrauti vaizdiniais
  • Jau netrukus „Chat GPT“ galės sugeneruoti ištisus vaizdo įrašus
  • „Microsoft“ DI pritaikyti planuoja ir populiariuosiuose „Office“ produktuose
Šaltiniai
„Chat GPT“
„Microsoft“ pristatė naują „Chat GPT“ versiją paveikslėliams. BoliviaInteligente/Unsplash nuotrauka

DI tobulėja neįtikėtinai sparčiai ir jau gali bendrauti vaizdiniais

Technologijų milžinė „Microsoft“ pristato naują „Chat GPT“ modelį, kuris apima ne tik tekstinius dirbtinio intelekto (DI) pajėgumus, tačiau ir įvairių tipų vizualius modelius, kurie leidžia su pokalbių robotu bendrauti vaizdiniais.

Tiesa, „Visual Chat GPT“ technologija nėra visiškai nėra. Tai jau anksčiau pristatytos ir visame pasaulyje išpopuliarėjusios „Chat GPT“ DI technologijos derinys su „Transformers“, „ControlNet“ ir „Stable Diffusion“ modeliais.

Tai reiškia, kad naujasis „Visual Chat GPT“ veikia kaip skirtingas DI funkcijas jungianti priemonė, leidžianti bendrauti tiek raštu, tiek ir vaizdais, ir daryti tai ypač kūrybingai.

Juk iki šiol „Chat GPT“ apsiribojo tik rašymu ir negalėjo savarankiškai apdoroti ar kurti vaizdų. Tačiau naudojant vizualinį „Chat GPT“ modelį, sistema gali pati generuoti vaizdą, jį keisti, iškirpti nepageidaujamus elementus ir atlikti daug daugiau veiksmų[1].

Tiesa, pirmieji „Visual Chat GPT“ išbandę ekspertai jau pastebėjo ir tam tikrų modelio trūkumų bei trikdžių. Pavyzdžiui, DI technologija gana nenuosekliai generuoja vaizdines užklausas, o tai dažniausiai yra būtent VFM modelių integravimo nesėkmė.

Ekspertai siūlo „Microsoft“ į „Visual Chat GPT“ integruoti savikontrolės mechanizmą, kuris užtikrintų, kad užklausos vykdymo rezultatai atitiktų tai, ką vartotojas iš tiesų nori išvysti, o ne tai, ką programa gali parengti. Tiesa, toks įdiegimas reikštų, kad paveikslėlius DI technologija generuotų ilgiau nei šiuo metu.

Jau netrukus „Chat GPT“ galės sugeneruoti ištisus vaizdo įrašus. Emiliano Vittoriosi/Unsplash nuotrauka
Jau netrukus „Chat GPT“ galės sugeneruoti ištisus vaizdo įrašus. Emiliano Vittoriosi/Unsplash nuotrauka

Jau netrukus „Chat GPT“ galės sugeneruoti ištisus vaizdo įrašus

Kol vizualinė „Chat GPT“ versija dar laukia paskutinių patobulinimo detalių, „Microsoft“ nestabdo savo ambicijų dirbtinio intelekto srityje ir net skelbia, jog netrukus išleis dar sudėtingesnį ir pažangesnį „Chat GPT“ modelį.

Tai bus jau ketvirtosios kartos „GPT-4“, kuris turėtų gebėti greičiau ir tiksliau suprasti žmogaus kalbą, kalbos manierizmą ir šnekamosios kalbos akcentus.

Tokią naujieną patvirtino pats Andreas Braunas, „Microsoft“ vyriausiasis technologijų vadovas Vokietijoje. Jis patikino, kad „GPT-4“ visuomenei bus pristatytas netrukus ir atskleidė, kad naujasis DI modelis turės ne vieną gana intriguojančią ir įdomią funkciją.

Pavyzdžiui, manoma, kad viena iš svarbiausių naujų „GPT-4“ funkcijų bus daugiamodalumas, kuris leis DI apdoroti ir interpretuoti informaciją įvairiais būdais, ne tik raštu, bet ir garso bei vaizdo pagalba[2]. Tai reiškia, kad pasitelkus „GPT-4“ bus galima kurti net vaizdo įrašus.

Tokia galimybė ženkliai praplėstų DI generuojamo turinio asortimentą ir galėtų iš esmės pakeisti vaizdo įrašų kūrimą įvairiose veiklos šakose ir sferose: nuo edukacijos, iki komunikacijos ar net meno technologijų.

Tiesa, „Open AI“, kuri ir sukūrė „Chat GPT“, vykdomasis direktorius Samas Altmanas teigia, kad dėdami tokias dideles viltis į kiekvieną projekto atnaujinimą, žmonės tiesiog prašosi būti nuvilti.

Tačiau jei „GPT4“ iš tiesų bus toks pajėgus ir leis žmonėms generuoti vaizdus, garsus ir vaizdo įrašus iš paprastų teksto užklausų, šis patobulinimas gali tapti tikra revoliucija[3].

Jau anksčiau su „Open AI“ bendradarbiaujančios „Microsoft“ Vokietijos padalinio vykdomoji direktorė Marianne Janik teigė, kad dabar matoma dirbtinio intelekto plėtra ir „Chat GPT“ sukūrimas yra „lūžio momentas, primenantis „iPhone momentą“.
„Microsoft“ DI pritaikyti planuoja ir populiariuosiuose „Office“ produktuose. Matthew Manuelio/Unsplash nuotrauka
„Microsoft“ DI pritaikyti planuoja ir populiariuosiuose „Office“ produktuose. Matthew Manuelio/Unsplash nuotrauka

„Microsoft“ DI pritaikyti planuoja ir populiariuosiuose „Office“ produktuose

Paskutiniais mėnesiais tiek technologijų įmonių, tiek pačių vartotojų susidomėjimas dirbtinio intelekto technologijomis, jų plėtra ir galimybėmis išaugo it ant mielių.

Nuo „Meta“, iki „Google“, nuo „Open AI“, iki „Microsoft“. Visos šios kompanijos turi didžiulių ambicijų užkariauti DI sektorių. Ypač didelių planų turi anksčiau jau minėta „Microsoft“.

Tampa aišku, kad kompanija yra užtikrinta tuo, kad dabartinis susižavėjimas DI nėra tik trumpalaikė tendencija ir mada. Tai rodo milžiniškos investicijos, kurias bendrovė meta į savąjį DI sektoriaus plėtimą. Negana to, apie reikšmingus planus signalizuoja ir apdairiai atskleidžiamos grandiozinės idėjos.

Šių metų pradžioje paskelbusi apie 10 mlrd. dolerių investicijas į „Chat GPT“ sukūrusią bendrovę „OpenAI“, „Microsoft“ jau integravo šią technologiją į savo „Bing“ paieškos sistemos variklį, o dabar kalba ir apie platesnio masto integraciją į kitus savo kompanijos produktus, kurie daugeliui yra plačiai naudojami bene kasdien.

„Microsoft“ kompanijos generalinis direktorius Satja Nadella neseniai sakė, kad ateityje, „kiekvienas „Microsoft“ produktas turės tam tikras tokias pačias dirbtinio intelekto galimybes“[4].

Tokie teiginiai paskatino diskusijas ir spėliones, ar „Microsoft“ DI technologijas žada pritaikyti ir savo programinės įrangos paketuose „Microsoft Office“ ir „Office 365“.

Juk būtent į šiuos programinės įrangos paketus įeina ir taip plačiai visame pasaulyje naudojami įrankiai, tokie kaip „Word“, „Excel“ , „PowerPoint“ arba „Outlook“.

Ekspertai linkę spėti, kad artimiausiu metu „Microsoft“ bandys pritaikyti sąlyginai nesudėtingas DI funkcijas. Pavyzdžiui, prie „Outlook“ programos priderinus dirbtinio intelekto pajėgumus, būtų galima sukurti automatinio elektroninių laiškų rašymo sistemą.

Tuo tarpu „Excel“ atveju, kalbama apie automatinės skaičiuoklės formatavimo galimybę, o „Word“ programoje būtų galima automatizuoti daugelį rašymo ir raštvedybos funkcijų.

Nors apie tokius pokyčius šiuo metu dar tik diskutuojama, ekspertai linkę pastebėti, kad DI pritaikymas „Microsoft Office“ produktuose reikšmingai pakeistų daugelio biuro darbuotojai kasdienybę ir leistų sutaupyti daugybę laiko, kuris įprastai yra skiriamas tokioms smulkioms užduotims kaip prezentacijų rengimas ar atsakinėjimas į elektroninius laiškus.