Lietuvių kalbos ištekliai dirbtiniam intelektui: rezultatai ir prieiga
Per pastaruosius kelerius metus Lietuvoje buvo įgyvendinta viena didžiausių investicijų į lietuvių kalbos skaitmeninius išteklius. Vykdant 2021–2030 m. valstybės skaitmeninimo plėtros programos pažangos priemonę „Kurti technologinius sprendimus ir įrankius, leidžiančius saugiai naudotis paslaugomis“, sukurti nauji lietuvių kalbos duomenų rinkiniai, garsynai, tekstynai, ontologijos ir dirbtinio intelekto modeliams reikalingi ištekliai. Rezultatai tampa viešai prieinami visiems naudotojams.
Lietuvos mokslų akademija kartu su Lietuvos dirbtinio intelekto asociacija kviečia į viešą rezultatų pristatymo renginį, kuriame pirmą kartą vienoje vietoje bus apžvelgta:
• Kokie lietuvių kalbos ištekliai buvo sukurti ir kokias problemas jie sprendžia. • Kokie kalbos modeliai, tekstynai ir garsynai jau prieinami naudoti. • Kur ir kokiomis sąlygomis galima pasiekti sukurtus duomenų rinkinius. • Kaip verslas, mokslininkai, startuoliai ir viešasis sektorius gali panaudoti šiuos išteklius naujoms DI paslaugoms ir produktams kurti. • Kokios yra tolimesnės lietuvių kalbos technologijų ir generatyvinio DI vystymo perspektyvos Lietuvoje.
Renginio metu bus pristatyti svarbiausi sukurti ištekliai: lietuvių kalbos garsynai šnekos atpažinimui ir sintezei, bendrasis lietuvių kalbos tekstynas ir vektorizuoti modeliai, klausimų–atsakymų porų tekstynas, melagingos informacijos identifikavimo tekstynas, medicinos, gynybos ir saugumo sričių kalbiniai ištekliai, daugiakalbiai tekstynai bei kiti projektų rezultatai.
Renginys skirtas:
dirbtinio intelekto kūrėjams ir tyrėjams;
technologijų įmonėms ir startuoliams;
universitetų ir mokslo institucijų atstovams;
valstybės institucijoms;
kalbos technologijų ir atvirųjų duomenų bendruomenei.
Dalyvavimas nemokamas, tačiau registracija būtina.
Programa
Įvadinis žodis Linas Petkevičius, prof. Gintautas Dzemyda
Pranešimai
Gediminas Navickas Lietuvių kalbos garsyno vystymas (šnekos atpažinimo tikslams)
Erika Rimkutė Morfologiškai ir sintaksiškai anotuotų tekstynų modeliai apmokymui
Danguolė Kalinauskaitė Nuasmeninimo tekstyno sukūrimas Santraukų tekstynai dirbtiniam intelektui
Agnė Čepaitienė, Marius Glebus Kalbos paveldo transformacija ir lietuvių kalbos erdvinių duomenų išteklių sukūrimas
Darius Amilevičius Bendrasis lietuvių kalbos tekstynas ir vektorizuoti modeliai
Melagingos informacijos automatinio identifikavimo tekstynas Vienkalbių ir daugiakalbių tekstynų atnaujinimas Daugiakalbių ir vienkalbių tekstynų sukūrimas Sintetinių lygiagrečių tekstynų sukūrimas Žmogaus fenotipo ontologijos lietuvių kalba sukūrimas Lietuvių kalbos medicinos garsynas Lietuvių kalbos garsynas (šnekos sintezės tikslams neuroniniams balsams generuoti) Medicinos vienkalbis ir lygiagretieji tekstynai Gynybos ir saugumo vienkalbiai ir lygiagretieji tekstynai Klausimų–atsakymų porų tekstynas
Diskusija ir uždarymas
L. Petkevičius, prof. Gintautas Dzemyda
Tinklaveika
Užkandžiai ir neformalūs pokalbiai.