Virusiniu tapęs vaizdo įrašas, kuriame trys skirtingi pokalbių robotai kalba savo „slapta kalba“, surinko šimtus tūkstančių peržiūrų įvairiose socialinių tinklų platformose.
Vaizdo įraše matyti, kaip trys pokalbių robotai kalba telefonu anglų kalba ir aptaria „vieno darbuotojo pažymėjimo numerį“.
Kai šie įrenginiai suvokia, kad kalbasi su kitais robotais, jie vienas kito klausia, ar turėtų pereiti prie „Gibberlink“, ir tuomet pradeda skleisti aukšto dažnio garsus – tai primena sceną iš mokslinės fantastikos filmo.
„Gibberlink“ – tai terminas, sudarytas iš dviejų anglų kalbos žodžių „gibberish“ (paistalai) ir „link“ (ryšys). Nors šios technologijos pritaikymas kol kas gana ribotas, ji yra tikra. „Gibberlink“ leidžia dirbtinio intelekto sistemoms bendrauti tarpusavyje savo pačių „kalba“. Tačiau ši kalba nėra pačių DI robotų išradimas.
Hakatono produktas
Iš tikrųjų ši technologija buvo sukurta tik 2024 metų vasarį – ją per 24 valandų hakatoną Londone sukūrė AI inžinieriai Antonas Pidkuiko ir Borisas Starkovas.
Jie sujungė atvirojo kodo technologiją „GGWave“, leidžiančią perduoti duomenis garsais, su dirbtiniu intelektu.
Taigi, nors DI sistemos gali bendrauti tarpusavyje savita kalba, tai nėra „slapta“ kalba – visa tai paremta atviru programiniu kodu, sukurtu žmonių.
„Euronews“ faktų tikrintojai paprašė vieno iš šios technologijos kūrėjų – Antono Pidkuiko – įvertinti socialiniuose tinkluose platinamus vaizdo įrašus. Pasak jo, toli gražu ne visuose užfiksuotas DI tarpusavio „bendravimas“ – kai kurie tėra klastotės, kur keli greta sudėti išmanieji telefonai tiesiog skleidžia garsinį triukšmą.
Pasak A.Pidkuiko, ši technologija panaši į QR kodus: „Kiekvienas prekybos centro produktas turi kodą, kuris labai palengvina apsipirkimą.
„Gibberlink“ iš esmės yra tas pats brūkšninis ar QR kodas – tik perduodamas per garsą. Žmogus į QR kodą žiūri ir mato tik juodai baltus kvadratėlius. Tačiau QR kodai žmonių negąsdina“, – „Euronews“ komentavo jis.
Naujas senos technologijos pritaikymas ir jokio stebuklo
Kitas šios technologijos kūrėjas – Borisas Starkovas – savo „Linkedin“ paskyroje atsakė į dažniausiai kylančius klausimus apie išradimą.
Jis atskleidė, kaip jis buvo sukurtas ir kokiu būdu galėtų būti naudojamas.
Pateikiame jo įrašo vertimą į lietuvių kalbą:
Klausimas: Apie ką buvo šis projektas?
Atsakymas: Norėjome parodyti, kad pasaulyje, kuriame dirbtinio intelekto agentai gali skambinti ir priimti skambučius (tai jau vyksta šiandien), jie kartais bendrautų tarpusavyje. Tokiais atvejais žmonių kalbos generavimas būtų bereikalingas resursų, pinigų, laiko ir energijos švaistymas. Vietoj to, agentai turėtų iškart pereiti prie efektyvesnio bendravimo protokolo, kai tik atpažįsta, kad kalbasi su kitu DI agentu.
Klausimas: Ar DI agentai patys sukūrė šį protokolą?
Atsakymas: Ne! Jie buvo aiškiai nurodyti pereiti prie protokolo, jei manė, kad kita pusė taip pat yra jį palaikantis DI agentas.
Klausimas: Ar jūs išradote šį garso perdavimo protokolą?
Atsakymas: Ne! Panašūs algoritmai garso perdavimui buvo naudojami jau nuo 9-ojo dešimtmečio modemuose, ir nuo to laiko egzistuoja daugybė protokolų. Mes pasirinkome „GGWave“, nes tai buvo patogiausias ir stabiliausias sprendimas, kurį galėjome pritaikyti per „hakatono“ laiką.
Klausimas: Ar viskas buvo surežisuota?
Atsakymas: Ne, kodas buvo audituotas „ElevenLabs“. Demonstracijoje vienas agentas buvo paskatintas bandyti užsisakyti viešbučio kambarį vestuvėms, o kitas – priimti tokį užsakymą. Jie taip pat buvo paraginti pereiti prie garso lygio protokolo, jei manė, kad kita pusė – taip pat DI agentas. Tačiau kalbėdami su žmogumi, jie liktų prie įprastos kalbos.
Klausimas: Kaip DI išmoko naudotis garso lygio protokolu?
Atsakymas: Čia pasireiškia „ElevenLabs“ įrankių magija! Jie leidžia DI agentui tam tikromis sąlygomis vykdyti specialiai suprogramuotą kodą pagal užduotį (prompt’ą).
Kam ateityje galėtų būti naudojama „Gibberlink“?
Nors šiuo metu „Gibberlink“ technologijos taikymas yra labai ribotas, jos kūrėjai tiki, kad netrukus ji taps plačiau naudojama.
„Šiandien dirbtinis intelektas jau geba tiek skambinti, tiek atsiliepti į skambučius. Laikui bėgant vis dažniau girdėsime tokius robotų skambučius – ir vis dažniau matysime, kaip vienas dirbtinis intelektas bendrauja su kitu“, – „Euronews“ sakė vienas šios technologijos kūrėjų.
Nors ši technologija gali sumažinti žmonių tarpusavio bendravimą bei sumažinti „gyvų“ darbo vietų poreikį, kūrėjo vertinimu tai – pažangus sprendimas.
Pavyzdžiui, šis sprendimas galėtų būti pritaikytas restorane: žmogus paprašo DI asistento rezervuoti staliuką, tada šis DI paskambina į restoraną, kur skambutį priima restorano DI robotas. Šie du DI tarpusavyje bendrauja, o restorano DI užregistruoja staliuko rezervaciją.
„Jei yra robotas, mokantis visas kalbas ir visada pasiekiamas, linija niekada neužimta, o kalbos barjerų nelieka“, – privalumus dėstė kūrėjas.
15min verdiktas: iš dalies melas. DI kol kas nesukūrė savo kalbos, kuri būtų nesuprantama žmonėms. Vaizdo įrašuose robotai naudoja specifinę technologiją, kuri buvo sukurta žmonių ir turi atvirą kodą.
Publikacija parengta 15min bendradarbiaujant su „Meta“, kuria siekiama stabdyti klaidinančių naujienų plitimą socialiniame tinkle. Daugiau apie programą ir jos taisykles – čia.


