NAUJIENOS

Renata Špukienė: lietuviškų kalbinių technologijų naudojimas jau yra dabartis

Kategorija:

Miestas:
„Tilde IT“ – kalbos technologijų bendrovė, kurianti inovatyvius produktus ir paslaugas, užtikrinančias taisyklingą lietuvių kalbos vartojimą skaitmeninėje eroje. Pagrindinės „Tilde IT“ veiklos sritys – programinės įrangos lokalizavimas, techninės dokumentacijos vertimas, lietuvių kalbos palaikymo programinės įrangos kūrimas. Apie išmaniųjų technologijų parkalbinimą lietuviškai kalbamės su „„Tilde IT“ vadovė Renata Špukiene.
  
Gerbiama Renata, jau apsiprantame su mintimi, kad kalba, kurios nėra išmaniosiose technologijose, tarsi ir nebeturi ateities. Lietuva taip pat stengiasi savo kalbą perkelti į išmaniąsias technologijas. Kokiais ryškiausiais lietuvių kalbos perkėlimo į išmaniąsias technologijas pasiekimais galite pasidžiaugti? (tekstų vertimas, balso atpažinimas ir t. t.)

Viena iš plačiausiai ir jau ne vienerius metus naudojamų lietuvių kalbos technologijų yra mašininis vertimas. Tilde kartu su Vilniaus universitetu projekto metu sukūrė mašininio vertimo platformą https://vertimas.vu.lt/, kuria gali visi naudotis nemokamai: įkelti ir versti įvairaus formato dokumentus į kelias kalbas, išlaikant originalų dokumento vaizdą, galima įsidiegti mašininio vertimo įskiepį norimame internetiniame puslapyje ir versti jį į kelias kalbas, galima iš garso failų gauti transkribuotą tekstą, įdiktuoti norimą tekstą ir pan. Sistema pasiekiama naudojant ir kompiuterius, ir mobiliuosius įrenginius.

Kita kalbinė technologija, jau atėjusi, bet dar per mažai naudojama mūsų rinkoje, yra išmanieji pokalbių robotai. Tai tokie virtualieji asistentai, internetinėse svetainėse padedantys rasti jums reikalingą informaciją arba atsakyti į jūsų keliamus klausimus, nukreipti teisingu adresu arba padėti susisiekti su konsultantais-žmonėmis. Tai dirbtinio intelekto technologija, sukurta neuroninių tinklų metodikos pagrindu, leidžianti gana tiksliai nuspėti klausiančiojo ketinimą, kuris pateikiamas natūralia, laisva kalba, taip kaip mes šnekamės tarpusavyje. Rinkoje yra įvairių kartų pokalbių robotų, nuo visiškai elementarių, kurie atsako tik į labai konkrečius klausimus arba kalba tik viena- dviem temomis, iki trečios ar ketvirtos kartos išmaniųjų pokalbių robotų, kurie yra išties pažangūs, galintys kalbėti keliomis kalbomis, turintys savo asmenybę, atitinkantys organizacijos stilių, deklaruojantys organizacijos vertybes, gali būti draugiški arba oficialūs, turėti humoro jausmą, netgi girdėti, ką jūs sakote, ir atsakyti jums balsu. Išmanieji pokalbių robotai padeda organizacijose dirbantiems žmonėms efektyviau aptarnauti klientus, besikreipiančius telefonu ar internetu. Ypač tai aktualu piko valandomis, kai žmonėms nori greitų ir tikslių atsakymų ir nenori laukti skambučių eilėje. Tokie robotai turi nemažai privalumų – jie aptarnauja visą parą ir be poilsio dienų, jie nepyksta, nesinervina, nepavargsta ir visada stengiasi jums padėti. Puikus to pavyzdys yra VMI pokalbių asistentas Simas.

Dar viena technologija, kuri jau dabar yra naudojama, o ateityje bus itin paklausi, yra lietuvių šnekos atpažinimas, t. y. jums kalbant garsas paverčiamas tekstu. Jūs galite tekstą įdiktuoti, galite garso įrašą įkelti į sistemą ir gauti tekstą, paruoštą tekstinį dokumentą arba paruošus subtitrus. Šios technologijos panaudojimas yra labai platus – nuo komandų išmaniesiems įrenginiams ar protingiems namams, iki paskaitų, seminarų įrašų subtitravimo arba pavertimo paskaitų užrašais. Žurnalistams tai gali būti įrankis greitai interviu įrašą paverčiant straipsniu. Bet kurioje organizacijoje susirinkimo garso įrašai paverčiami susitikimo protokolu ir iškart po susirinkimo išsiunčiami dalyviams ir pan. Labai praktiška priemonė gydytojų darbe – apžiūrų, operacijų ar vizitacijų įrašai pateikiami tekstu specialiose tam pritaikytose programose.

Apie pritaikymo būdus būtų galime kalbėti daug, tačiau šie pavyzdžiai būtų ryškiausi ir labiausiai iliustruojantys lietuviškų kalbinių technologijų pritaikymą.

Teigiama, kad lietuvių kalba yra viena sudėtingiausių, tad kokie iššūkiai kyla dirbtinį intelektą prakalbinant lietuviškai?

Iššūkių yra nemažai ir nemažų. Kalbant apie pačių kalbinių technologijų vystymą vienas iš didžiausių iššūkių yra reikalingų duomenų surinkimas, pvz., mašininiam vertimui reikalingi įvairių kalbų keliasdešimties milijonų sakinių tekstynai iš įvairių sričių, šnekos atpažinimui – didžiuliai garsynai (įvairaus amžiaus, lyties, balso tembro, skirtingų tarmių ir savito tarimo garso įrašai). Kuo jų daugiau ir kuo jie įvairesni, tuo tiksliau atpažįstama šneka. O jau surinkus kalbinius duomenis prasideda kitas etapas – jų apdorojimas ir paruošimas neuroniniams tinklams mokytis. Jeigu duomenų per mažai (ypač kai kalbame apie mažąsias kalbas, tokias kaip lietuvių, latvių, estų ir pan.) arba kai kalba morfologiškai sudėtinga, reikalingi įvairūs eksperimentai ir moksliniai tyrimai išsiaiškinti, kaip technologijos gali veikti dar tiksliau ir pateikti geresnius rezultatus, ieškoma įvairių būdų, naujų metodikų, kuriami papildomi moduliai siekiant maksimalių rezultatų. Ne veltui Tilde ketverius metus iš eilės tapo pasaulinio mašininio vertimo konkurso nugalėtoja šalia tokių gigantų, kaip Google ar Microsoft.

Kai kalbama taisyklingai, be parazitinių žodelių, be tarmybių, taisyklingai kirčiuojama dirbtiniam intelektui lietuvių kalba gal ir lengviau įkandama, bet juk taip kalbama gan retai. Koks kelias: mums išmokti labai taisyklingai kalbėti lietuviškai ar ieškoti galimybių patobulinti dirbtinį intelektą?

Dirbtinį intelektą galime daug ko išmokyti, svarbu tik turėti reikalingų duomenų, o jų visada trūksta, ypač lietuvių kalba, paruošti tokius duomenis kainuoja daug. Tad kad technologijos mums tarnautų efektyviai ir dabar, o ne po penkerių metų, mums gali tekti šiek tiek prisitaikyti prie technologijų, išmokti su jomis dirbti, arba kaip mes sakome – jas tiesiog prisijaukinti. Juk kai nusiperkate naują mobilųjį telefoną ar skalbimo mašiną, irgi mokomės naudoti, pratinamės prie jų. Tas pats ir su kalbinėmis technologijomis.

Labai taisyklingai ir nereikia stengtis kalbėti, užtenka kalbėti aiškiai, natūraliu tempu, pakankamu garsu, be didelių foninių triukšmų, Beje, apmokyta technologija netgi moka atskirti įprastą foninį triukšmą nuo žmogaus kalbėjimo. Ir parazitinius žodžius moka atskirti. Bet jeigu šnekant naudojami kokie nors naujadarai, nelietuviški žodžiai, neįprastos santrumpos arba ta pati santrumpa tariama skirtingai (pvz., UNESCO), žinoma, technologija gali suklysti.

Kokios perspektyvos, dirbtinį intelektą prakalbinant lietuviškai?

Manau, kad apskritai ateityje lietuviškų kalbinių technologijų naudojimas tik didės, tai jau yra dabartis, ir tikrai bus ateitis. Mūsų įmonės siekis, kad visuose Lietuvoje naudojamuose įrankiuose, prietaisuose, technologijose atsirastų lietuvių kalba. Ir tai būtų taip pat savaime suprantama ir įprasta, kaip dabar savaime suprantama yra anglų kalba.

Ką manote apie išmaniųjų technologijų pritaikymą lietuvių kalbai tempus, ar reikalingas šio proceso spartinimas? Ko labiausiai pasigendate?

Technologijos jau išvystytos, tereikia jas pradėti naudoti kasdien, o paskui net nebeįsivaizduosime, kaip galėjome be jų gyventi iki šiol. Žinoma, paprasčiausia yra pradėti nuo savęs. Bandykime tai, kas jau yra sukurta ir išvystyta, naudokime dirbdami kasdienius įprastu darbus ir nejučia tai taps tokia pat norma, kaip kiekvienam turėti asmeninį mobilųjį telefoną. O juk kažkada tai atrodė neįmanoma.

Žinoma, spartesniam pritaikymui ir visuomenės įsitraukimui neužtenka tik visuomenės ar verslo poreikio, bet būtinas ir atitinkamas valstybės dėmesys bei skatinimas – ir iškeliant valstybės vystymosi prioritetus, ir inicijuojant projektus. Reikia idėjų nacionaliniu mastu, pavyzdžiui, sukurti nacionalinę išmaniųjų pokalbių robotų platformą, kurioje kiekviena valstybinė įstaiga turėtų savąjį išmaniųjų prokalbių robotą, efektyviai aptarnaujantį visus interesantus, nepaisant atostogų meto, darbuotojų trūkumo ar pervargimo, karo ar pandemijos.  Kiekvienas gyventojas galėtų būti aptarnaujamas valstybinėse įstaigose jam neišeinant iš namų, taupant savo ir valstybės tarnautojų laiką, tausojant aplinką, nes nereikia niekur važiuoti, ieškoti vietos automobiliui. Tokiu būdu gali būti skatinama ir tvariau gyventi. Skaitmeninė visuomenė, arba visuomenė, mokanti naudotis el. paslaugomis, yra ateitis.

Kaip Lietuva, pritaikant savo valstybinei kalbai išmaniąsias technologijas, atrodome pasaulyje?

Lietuviškų kalbinių technologijų vystymas niekuo nenusileidžia kitų pasaulio kalbų technologijų vystymui, esame greta didžiųjų vystytojų, turime puikius ekspertus, bendradarbiaujame su pasaulio universitetais, publikuojame mokslinius straipsnius ir tarptautinėse konferencijose skaitome pranešimus. Tačiau lietuviškai kalbančių technologijų pritaikymas yra ne toks greitas, kaip norėtųsi. Esame maža šalis, nesame kol kas įdomūs kalbinių technologijų gigantams, pvz., Apple Siri dar nekalba lietuviškai. Betgi mes esame atkakli tauta, tad anksčiau ar vėliau ir tai taps realybe. O kol kas turime dirbti visi kartu – ir verslas, ir valstybė, ir visi jos piliečiai, kad idėjos ir norai turėti lietuviškai kalbančias technologijas būtų įgyvendinti.

Dėkoju už pokalbį.

Kalbino Karolina Baltmiškė
 
 
 

Reklama