Dabar populiaru
Pažymėkite klaidą tekste, pele prispaudę kairijį pelės klavišą

Mokslo bendruomenė pasišovė išmokyti kompiuterį suprasti lietuvių šneką

L.Telksnio teigimu, sunkiau ne lietuviškai prakalbinti kompiuterį, o priversti jį suprasti lietuvių kalbą
123rf nuotr. / L.Telksnio teigimu, sunkiau ne lietuviškai prakalbinti kompiuterį, o priversti jį suprasti lietuvių kalbą
Šaltinis: 15min
0
Skaitysiu vėliau
A A

Kompiuteriai ir išmanieji telefonai ateityje supras bei šnekės lietuviškai. Tokį uždavinį išsikėlė projekto „Lietuvių šneka valdomos paslaugos“ (sutr. „Liepa“) vykdytojai, planuojantys pirmuosius vaisius raškyti jau 2015-aisiais.

Su šio projekto vadovu, Vilniaus universiteto (VU) profesoriumi Laimučiu Telksniu dar prieš metus kalbėjome apie tai, kad netrukus su kompiuteriu dirbsime šnekėdamiesi. Pasirodo, ankstesnis interviu turėjo potekstę, tad šį straipsnį galima vadinti jo tęsiniu (kulminacijos, deja, dar teks palūkėti).

Laimutis Telksnys
Laimutis Telksnys

Susitikimą L.Telksnys pradeda cituodamas „Microsoft“ strategą Davidą Brooksą, kuris yra sakęs, jog kalba, kuri nepasklis elektroninėje terpėje, greitai taps nenaudojama.

„Šneka yra bendruomenę vienijanti jėga. Jei mes pamesime savo šneką, savo kalbą, galbūt ir mes patys išnyksime. Bet gerai yra tai, kad nuo šių metų vasario mėnesio pradėtas projektas „Liepa“, – šypteli L.Telksnys.

Šiam projektui vadovauja Vilniaus universitetas, taip pat dalyvauja Lietuvos edukologijos universitetas, Šiaulių universitetas ir Lietuvių kalbos institutas. Jo metu bus sukurti įrankiai, kurie „išmokys“ kompiuterinę techniką ne tik šnekėti lietuviškai, bet ir suprasti lietuvių kalbą. Šiuos įrankius L.Telksnys vadina atpažintuvu (atpažįsta tai, kas yra pasakoma) ir sintezatoriumi (įgarsina tai, kas yra užrašyta tekstu).

„Visa tai bus prieinama viešai – bus kuriama atviro kodo programinė įranga. Taigi jei kas nors sugalvos kokias nors naujas paslaugas, turės galimybę jas kurti. Mes gaminame motorą, o kokį kėbulą uždėsite ir ką juo vešite – tik jūsų reikalas, – sako L.Telksnys. – Koncepcija yra tokia, kad šitos naujos šnekos technologijos turėtų kuo labiau paplisti, apimti plačius sluoksnius – nuo vaikų iki senelių. Nes tik tokiu būdu mes įeisime į elektroninę terpę su savo šneka.“

Šneka yra bendruomenę vienijanti jėga. Jei mes pamesime savo šneką, savo kalbą, galbūt ir mes patys išnyksime, – sako L.Telksnys.

Projekto metu, be minėto „variklio“, bus kuriamos šešios paslaugos. Pavyzdžiui, ketinama sukurti programą, kuri galės konspektuoti žmogaus sakomus žodžius, taigi el. laišką (o gal net visą straipsnį) bus galima tiesiog padiktuoti kompiuteriui. Kita programa galės perskaityti pateiktą tekstą, mokys taisyklingai tarti žodžius. Moksleiviai galės šnekėdamiesi su kompiuteriu mokytis ląstelės sandaros ar sužinoti apie „UNESCO“ saugomus objektus.

„Tarkime, pareinate namo ir norite, kad kas nors pasakytų naujausias žinias – apie politiką, sportą ar orą. Pasakote, kad jus domina sporto naujienos, o kompiuteris iš 15min.lt ištraukia svarbiausias naujienas ir perskaito balsu“, – ateities viziją brėžia L.Telksnys.

Anksčiau anglakalbiams pritaikytus teksto sintezatorius išbandžiusius skaitytojus veikiausiai nupurtė lengvas šiurpas. Profesorius pastebi, kad technologijos gerokai patobulėjo, o kuriamas specialiai lietuvių kalbai pritaikytas sintezatorius veiks kur kas tobuliau. Ir šnekės ne roboto, o žmogaus balsu.

Šio projekto sintezatorius dar yra tobulinamas, bet 15min.lt skaitytojai gali pirmieji įvertinti, kaip tekstą įgarsina sintezatorius, kuriam balsą paskolino diktorė Regina Jokubauskaitė:

VIDEO: Kompiuteriniu sintezatoriumi įgarsintas lietuviškas tekstas
Kompiuteriniu sintezatoriumi įgarsintas lietuviškas tekstas

Tačiau ne sintezatorius, o šnekos atpažintuvas kelia didžiausius iššūkius „Liepa“ projekto vykdytojams.

„Anglams su vokiečiais bepigu – pas juos žodžių tvarka aiški. O lietuvių kalboje žodžių tvarka sakinyje yra kokia tik nori, be to, lietuvių kalboje labai daug informacijos perduoda galūnės. Visa tai padaro labai sudėtingą šnekos technologijų panaudojimą, nes reikia daugybės pavyzdžių. Kuo daugiau jų turi, tuo tiksliau atpažintuvas veikia“, – pabrėžia L.Telksnys.

Amerikiečiai kurdami šnekos atpažinimo įrangą panaudojo per ketvirtį milijardo žodžių pavyzdžių. L.Telksnys mano, kad lietuviams jų reikės dar daugiau. „Šiuo metu garsynas renkamas. Bet vien perskaityti teksto neužtenka, kompiuteris garsų juk nepažįsta. Juos dar reikia specialiai užkoduoti, o tai yra didelis darbas, – sako VU profesorius. – Bet tai kainuoja ir staigiai mes visko nepadarysime. Šiame etape tiek tikrai niekas nesurinks, čia bus nebent keli milijonai. Mes planuojame, kad šis darbas, kai baigsis 2015 metais, bus tik pirmas etapas, o vėliau projektas bus tęsiamas.“

Komentarai
Pažymėkite klaidą tekste, pele prispaudę kairijį pelės klavišą
Pranešti klaidą

Pranešti klaidą

Sėkmingai išsiųsta

Dėkojame už praneštą klaidą
Daugiau straipsnių nėra
Rodyti senesnius straipsnius
Parašykite atsiliepimą apie Mokslas.IT