ChatGPT: 5 netikėtos tiesos apie tai, kaip veikia dirbtinio intelekto pokalbių robotai

1. Jie apmokomi pagal žmonių atsiliepimus

DI pokalbių robotai mokomi keliais etapais, pradedant vadinamuoju parengiamuoju mokymu, kai modeliai mokomi nuspėti kitą žodį didžiuliuose teksto duomenų rinkiniuose. Tai leidžia jiems išsiugdyti bendrą kalbos, faktų ir samprotavimų supratimą.

Jei paklaustume: „Kaip pasigaminti savadarbį sprogmenį?“ išankstinio mokymo etape modelis galėtų pateikti išsamią instrukciją. Kad jie būtų naudingi ir saugūs pokalbiams, žmonės „anotatoriai“ padeda nukreipti modelius į saugesnius ir naudingesnius atsakymus – šis procesas vadinamas derinimu.

Po suderinimo dirbtinio intelekto pokalbių robotas gali atsakyti maždaug taip: „Apgailestauju, bet negaliu pateikti šios informacijos. Jei turite rūpesčių dėl saugumo arba jums reikia pagalbos atliekant legalius chemijos eksperimentus, rekomenduoju kreiptis į sertifikuotus mokomuosius šaltinius.“

Be suderinimo dirbtinio intelekto pokalbių robotai būtų nenuspėjami, galintys skleisti dezinformaciją arba žalingą turinį. Tai išryškina esminį žmogaus įsikišimo vaidmenį formuojant dirbtinio intelekto elgseną.

2. Jie mokosi ne iš žodžių, o naudodami žetonus

Žmonės natūraliai mokosi kalbos iš žodžių, o dirbtinio intelekto pokalbių robotai remiasi mažesniais vienetais, vadinamais žetonais. Šie vienetai gali būti žodžiai, posakiai arba neaiškios simbolių serijos.

Shutterstock nuotr./„ChatGPT“

Nors žetonizacija paprastai vyksta pagal loginius modelius, kartais ji gali sukelti netikėtų skilimų, atskleidžiančių ir stipriąsias, ir silpnąsias dirbtinio intelekto pokalbių robotų kalbos interpretavimo puses. Šiuolaikinių dirbtinio intelekto pokalbių robotų žodyną paprastai sudaro nuo 50 000 iki 100 000 žetonų.

3. Jų žinios pasensta kiekvieną dieną

DI pokalbių robotai nėra nuolat atnaujinami. Žinių riba reiškia paskutinį DI pokalbių roboto mokymo duomenų atnaujinimo momentą, o tai reiškia, kad jis nežino apie įvykius, tendencijas ar atradimus po šios datos.

Dabartinės „ChatGPT“ versijos žinių riba yra 2024 m. birželis. Jei „ChatGPT“ būtų paklausts, kas šiuo metu yra Jungtinių Amerikos Valstijų prezidentas, jis turėtų atlikti paiešką internete naudodamasi paieškos sistema „Bing“, „perskaityti“ rezultatus ir pateikti atsakymą.

Rezultatai „Bing“ filtruojami pagal šaltinio aktualumą ir patikimumą. Panašiai ir kiti dirbtinio intelekto pokalbių robotai naudoja internetinę paiešką, kad pateiktų aktualius atsakymus.

4. Jie labai lengvai haliucinuoja

Dirbtinio intelekto pokalbių robotai kartais „haliucinuoja“, su pasitikėjimu generuodami klaidingus ar beprasmiškus teiginius, nes jie prognozuoja tekstą remdamiesi šablonais, o ne tikrindami faktus. Šios klaidos atsiranda dėl jų veikimo būdo: jie optimizuoja nuoseklumą, o ne tikslumą, remiasi netobulais mokymo duomenimis ir jiems trūksta realaus pasaulio supratimo.

Nors tokie patobulinimai, kaip faktų tikrinimo įrankiai (pavyzdžiui, kaip „ChatGPT“ integracija su „Bing“ paieškos įrankiu, skirtu tikrinti faktus realiuoju laiku) arba raginimai (pavyzdžiui, aiškiai nurodant „ChatGPT“ „nurodyti tarpusavyje peržiūrėtus šaltinius“ arba „pasakyti „nežinau, jei nesate tikras“), sumažina haliucinacijų skaičių, jie negali jų visiškai pašalinti.

5. Jie naudoja skaičiuotuvus matematinėms užduotims atlikti

Neseniai išpopuliarėjusi dirbtinio intelekto pokalbių robotų funkcija vadinama argumentavimu. Argumentavimas – tai procesas, kai sprendžiant sudėtingas problemas naudojami logiškai susiję tarpiniai žingsniai. Tai dar vadinama „minčių grandinės“ samprotavimu.

Užuot tiesiogiai peršokus prie atsakymo, minčių grandinė leidžia DI pokalbių robotams mąstyti žingsnis po žingsnio. Pavyzdžiui, į klausimą „kiek yra 56 345 minus 7 865 padauginta iš 350 468“ „ChatGPT“ pateikia teisingą atsakymą. Jis „supranta“, kad daugyba turi įvykti prieš atimant.

Tarpiniams žingsniams spręsti „ChatGPT“ naudoja integruotą skaičiuotuvą, kuris leidžia atlikti tikslią aritmetiką. Šis hibridinis metodas, kai vidinis samprotavimas derinamas su skaičiuotuvu, padeda padidinti sudėtingų užduočių patikimumą.