Daugiakalbių ir vienkalbių tekstynų sukūrimas-2 |2021-2027 ES investicijų interneto svetainė

Nr. 02-107-P

Nėra galimybės teikti PĮP

Teikiama nuo

2024-05-07 14:00

Teikiama iki

2024-06-30 17:00 Pasibaigęs

Kvietimo finansavimo suma

798 600,00 €

Projektų atrankos būdas

Planavimas

Finansavimo forma

Dotacija

Kontaktai

Irina Kaminskienė

Centrinė projektų valdymo agentūra

Vyresnysis projektų vadovas

37065468590 Ir.Kaminskiene@cpva.lt

Finansuojamos veiklos	Galimi pareiškėjai	Didžiausia suma vienam projektui	Finansuojamoji dalis	Regionas
Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra (planavimo būdu)	Informacinės visuomenės plėtros komitetas	0,00 €	100%	Netaikoma

Bendra informacija:

Pažangos priemonė

Kurti technologinius sprendimus ir įrankius, leidžiančius saugiai ir patogiai naudotis paslaugomis
Konkretus uždavinys

Būtinosios sąlygos inovatyviems technologiniams sprendimams versle ir kasdieniame gyvenime
Veiklos numeris

05-002-01-07-08-02-02
Pareiškėjo tipas

Viešasis
Tikslinės grupės

Viešieji ir privatūs juridiniai asmenys
Išlaidų tinkamumo reikalavimai

1.Projekto išlaidoms taikomi Projektų administravimo ir finansavimo taisyklių VII skyriuje išdėstyti projekto išlaidų reikalavimai. Nustatant projekto išlaidų tinkamumą vadovaujamasi ir Rekomendacijomis dėl projektų išlaidų atitikties Europos Sąjungos fondų reikalavimams, kurios skelbiamos ES investicijų interneto svetainėje https://2021.esinvesticijos.lt/dokumentai/rekomendacijos-del-projektu-islaidu-atitikties-europos-sajungos-fondu-reikalavimams?version=1#prevVersions.
2. Projekto išlaidos gali būti patirtos iki projekto sutarties pasirašymo, jei tai neprieštarauja Projektų administravimo ir finansavimo taisyklių 294.2.2 papunkčio nuostatoms.
3. Projekto vykdytojui gali būti mokamas avansas, vadovaujantis Projektų administravimo ir finansavimo taisyklių 153 punktu.
4. Pridėtinės vertės mokestis (toliau – PVM) nėra tinkamas finansuoti EGADP lėšomis. PVM gali būti finansuojamas Lietuvos biudžeto lėšomis, vadovaujantis Projektų administravimo ir finansavimo taisyklių ketvirtajame skirsnyje nustatyta tvarka.
5. Netinkamos finansuoti projekto lėšos:
5.1. transporto priemonių pirkimo, lizingo (finansinės nuomos), eksploatavimo ir susijusios išlaidos;
5.2. žemės pirkimo išlaidos;
5.3. įgyvendinant projektą naudojamo ilgalaikio turto nusidėvėjimo (amortizacijos) sąnaudos;
5.4. nepiniginis projekto vykdytojo ir (arba) projekto partnerio įnašas.
6. Kryžminis finansavimas netaikomas.
7. Didžiausia galima projekto finansuojamoji dalis sudaro 100 proc. visų tinkamų finansuoti projekto išlaidų. Netinkamos finansuoti išlaidos ir projekto tinkamų finansuoti išlaidų dalis, kurios nepadengia projektui skiriamos finansavimo lėšos, turi būti finansuojamos iš projekto vykdytojo lėšų.
8. Pareiškėjas ir partneris savo iniciatyva bei savo ir (arba) kitų šaltinių lėšomis gali prisidėti prie projekto įgyvendinimo.

Taikomi supaprastintai apmokamų išlaidų dydžiai

Kodas	Versija	Pavadinimas	Dydis	Matavimo vnt.	Papildoma informacija
FN-005-05	01	Fiksuotoji norma, taikoma, kai priklauso nuo 37 iki 39 d. d. (jeigu dirbama 5 d. d. per savaitę) arba nuo 43 iki 47 d. d. (jeigu dirbama 6 d. d. per savaitę) kasmetinės atostogos	17,2500	%	https://2021.esinvesticijos.lt/dokumentai/fn-05-01-fn-05-07-kasmetiniu-atostogu-ismoku-fn
FN-005-04	01	Fiksuotoji norma, taikoma, kai priklauso nuo 31 iki 36 d. d. (jeigu dirbama 5 d. d. per savaitę) arba nuo 37 iki 42 d. d. (jeigu dirbama 6 d. d. per savaitę) kasmetinės atostogos	14,9900	%	https://2021.esinvesticijos.lt/dokumentai/fn-05-01-fn-05-07-kasmetiniu-atostogu-ismoku-fn
FN-005-02	01	Fiksuotoji norma, taikoma, kai priklauso nuo 21 iki 25 d. d. (jeigu dirbama 5 d. d. per savaitę) arba nuo 25 iki 30 d. d. (jeigu dirbama 6 d. d. per savaitę) kasmetinės atostogos	10,4400	%	https://2021.esinvesticijos.lt/dokumentai/fn-05-01-fn-05-07-kasmetiniu-atostogu-ismoku-fn
FN-005-03	01	Fiksuotoji norma, taikoma, kai priklauso nuo 26 iki 30 d. d. (jeigu dirbama 5 d. d. per savaitę) arba nuo 31 iki 36 d. d. (jeigu dirbama 6 d. d. per savaitę) kasmetinės atostogos	12,3500	%	https://2021.esinvesticijos.lt/dokumentai/fn-05-01-fn-05-07-kasmetiniu-atostogu-ismoku-fn
FN-005-01	01	Fiksuotoji norma, taikoma, kai priklauso 20 d. d. (jeigu dirbama 5 d. d. per savaitę) arba 24 d. d. (jeigu dirbama 6 d. d. per savaitę) kasmetinės atostogos.	8,6300	%	https://2021.esinvesticijos.lt/dokumentai/fn-05-01-fn-05-07-kasmetiniu-atostogu-ismoku-fn
FN-005-07	01	Fiksuotoji norma, taikoma, kai priklauso nuo 41 d. d. (jeigu dirbama 5 d. d. per savaitę) arba nuo 49 d. d. (jeigu dirbama 6 d. d. per savaitę) kasmetinės atostogos	20,0200	%	https://2021.esinvesticijos.lt/dokumentai/fn-05-01-fn-05-07-kasmetiniu-atostogu-ismoku-fn
FN-005-06	01	Fiksuotoji norma, taikoma, kai priklauso 40 d. d. (jeigu dirbama 5 d. d. per savaitę) arba 48 d. d. (jeigu dirbama 6 d. d. per savaitę) kasmetinės atostogos	18,8900	%	https://2021.esinvesticijos.lt/dokumentai/fn-05-01-fn-05-07-kasmetiniu-atostogu-ismoku-fn
FN-001-01	01	Iki 7 proc. netiesioginių išlaidų fiksuotoji norma	7,0000	%	https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX%3A32021R1060
FS-001-02	03	Įgyvendintų privalomų matomumo ir informavimo priemonių apie ES fondų investicijų veiklas fiksuotoji suma, pirmojo rinkino FS su PVM	24,4300	EUR	https://2021.esinvesticijos.lt/dokumentai/fs-01-01-fs-01-04-viesinimo-fs
FS-001-01	03	Įgyvendintų privalomų matomumo ir informavimo priemonių apie ES fondų investicijų veiklas fiksuotoji suma, pirmojo rinkino FS be PVM	20,1900	EUR	https://2021.esinvesticijos.lt/dokumentai/fs-01-01-fs-01-04-viesinimo-fs
FS-001-03	03	Įgyvendintų privalomų matomumo ir informavimo priemonių apie ES fondų investicijų veiklas fiksuotoji suma, antrojo rinkino FS be PVM	1464,9800	EUR	https://2021.esinvesticijos.lt/dokumentai/fs-01-01-fs-01-04-viesinimo-fs
FS-001-04	03	Įgyvendintų privalomų matomumo ir informavimo priemonių apie ES fondų investicijų veiklas fiksuotoji suma, antrojo rinkino FS su PVM	1772,6300	EUR	https://2021.esinvesticijos.lt/dokumentai/fs-01-01-fs-01-04-viesinimo-fs

Siekiami stebėsenos rodikliai

Pavadinimas	Kodas	Matavimo vnt.	Minimali siektina reikšmė projektui
Sukurti lietuvių kalbos ištekliai, reikalingi dirbtinio intelekto sprendimams kurti	P.S.1.1075	vnt.	3,00
Pateikti lietuvių kalbos ištekliai, skirti dirbtiniam intelektui ir inovatyvioms technologijoms plėtoti	P.S.1.1074	vnt.	3,00

Finansavimo šaltiniai

ES Fondas	Ekonomikos gaivinimo ir atsparumo didinimo priemonė
EGADP subsidijos lėšos	660 000,00 €
Valstybės biudžeto lėšos, skirtos ES fondų lėšomis netinkamam finansuoti PVM apmokėti	138 600,00 €

Taikomi teisės aktai

1. 2021 m. vasario 12 d. Europos Parlamento ir Tarybos reglamentas (ES) 2021/241, kuriuo nustatoma Ekonomikos gaivinimo ir atsparumo didinimo priemonė;
2. Ekonomikos gaivinimo ir atsparumo didinimo planas „Naujos kartos Lietuva“, patvirtintas 2021 m. liepos 28 d. Tarybos įgyvendinimo sprendimu dėl Lietuvos ekonomikos gaivinimo ir atsparumo didinimo plano įvertinimo patvirtinimo (toliau – NKL planas);
3. 2021–2027 metų Europos Sąjungos fondų investicijų programos ir Ekonomikos gaivinimo ir atsparumo didinimo plano „Naujos kartos Lietuva“ administravimo taisyklės, patvirtintos Lietuvos Respublikos finansų ministro 2022 m. birželio 22 d. įsakymu Nr. 1K-237 „Dėl 2021–2027 metų Europos Sąjungos fondų investicijų programos ir Ekonomikos gaivinimo ir atsparumo didinimo plano „Naujos kartos Lietuva“ įgyvendinimo“;
4. Projektų administravimo ir finansavimo taisyklės, patvirtintos Lietuvos Respublikos finansų ministro 2022 m. birželio 22 d. įsakymu Nr. 1K-237 „Dėl 2021–2027 metų Europos Sąjungos fondų investicijų programos ir Ekonomikos gaivinimo ir atsparumo didinimo plano „Naujos kartos Lietuva“ įgyvendinimo“ (toliau – Projektų administravimo ir finansavimo taisyklės)
Specialieji teisės aktai

1. Lietuvos Respublikos mokslo ir studijų įstatymas;
2. Lietuvos Respublikos valstybinės kalbos įstatymas;
3. Lietuvos Respublikos technologijų ir inovacijų įstatymas;
4. Lietuvos Respublikos Seimo 2020 m. spalio 13 d. nutarimas Nr. XIII-3324 „Dėl Lietuvių kalbos plėtros skaitmeninėje terpėje ir kalbos technologijų pažangos 2021–2027 metų gairių patvirtinimo“;
5. 2021–2030 metų nacionalinis pažangos planas, patvirtintas Lietuvos Respublikos Vyriausybės 2020 m. rugsėjo 9 d. nutarimu Nr. 998 „Dėl 2021–2030 metų nacionalinio pažangos plano patvirtinimo“;
6. 2021–2030 metų Lietuvos Respublikos ekonomikos ir inovacijų ministerijos valstybės skaitmeninimo plėtros programa, patvirtinta Lietuvos Respublikos Vyriausybės 2021 m. lapkričio 17 d. nutarimu Nr. 971 „Dėl 2021–2030 metų Lietuvos Respublikos ekonomikos ir inovacijų ministerijos valstybės skaitmeninimo plėtros programos patvirtinimo“ (toliau – Programa).

Reikalavimai projektams

Pagal Aprašą remiama veikla – kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra. Projektui „Sintetinių lygiagrečių tekstynų sukūrimas“ įgyvendinti skiriama iki 660 000 Eur ( šešių šimtų šešiasdešimt tūkstančių eurų) Ekonomikos gaivinimo ir atsparumo didinimo priemonės lėšų ir iki 138 600 Eur ( šimto trisdešimt aštuonių tūkstančių šešių šimtų eurų) Lietuvos Respublikos valstybės biudžeto lėšų, skirtų netinkamam pridėtinės vertės mokesčiui (toliau – PVM) apmokėti. PVM gali būti finansuojamas tik Projektų administravimo ir finansavimo taisyklių VII skyriaus 4 skirsnyje nustatyta tvarka.
Galimas pareiškėjas: Informacinės visuomenės plėtros komitetas.
Privalomi techniniai reikalavimai tekstynui:
1. Sintetinio tekstyno kūrimas prasideda nuo neuroninio mašininio vertimo sistemos (toliau - NMVS) treniravimo lygiagretaus tekstyno analizės. Pasirenkama kalbų pora. Situacijos analizei pasirenkama fleksinė kalba, šiuo atveju lietuvių. Iš lietuviškosios tekstyno dalies ekstrahuojamas įvardintųjų esybių (toliau - ĮE) sąrašas. Išrenkami gerai tekstyne reprezentuojamų ĮE kontekstai sakinių lygyje. ĮE sąrašas kategorizuojamas. Iš šių išsirinktų kontekstinių sakinių konstruojami atskiri kontekstiniai šablonai, individualūs kiekvienai ĮE kategorijai, pvz. miestų, upių pavadinimų ar pavardžių kontekstiniai šablonai. Vienas šablonas – tai du lygiagretūs sakiniai su pakeitimams numatytomis vietomis. Kontekstiniai šablonai turi apimti visas ĮE gramatines formas (linksnius), o taip pat visų į šabloną parinktų lietuviškų sakinių vertimus į kitą kalbą. Visi šie šablonai lingvistiškai anotuojami.
2. Antrajame etape konstruojamas norimų įterpti į NMVS ĮE sąrašas, atsižvelgiant į iš treniravimo tekstyno ekstrahuotą sąrašą. Įterpimo sąrašas išplečiamas visomis galimomis ĮE gramatinėmis formomis. Šis sąrašas dvikalbis, jis taip pat analogiškai lingvistiškai anotuojamas ir suskirstomas į kategorijas, atitinkančias paruoštų kontekstinių šablonų kategorijas.
3. Trečiajame etape užpildomi kontekstiniai šablonai. Jie automatiškai pildomi pagal kategorijas, keičiant šablonų esančią ĮE kita įvardijama esybe iš įterpimo sąrašo su atitinkama anotavimo žyma. Iš treniravimo tekstyno kuriami šablonai po įterpimo į vertimo sistemą minimaliai paveikia vektorinę vertimo sistemos struktūrą, todėl sistemą tokiu metodu galima papildyti dideliu kiekiu įvardintųjų esybių (ar įvairių sričių terminų). Užpildytų šablonų visuma sudaro sintetinį lygiagretųjį tekstyną, kuris naudojamas NMVS treniravimui.
4. Analogiški veiksmai atliekami sintezuojant medicinos terminų tekstynus. Kategorizuojant medicinos terminus naudojama SNOMED CT medicininė ontologija. Kategorizuojant sukuriami vienodo hierarchinio lygio terminų klasteriai. Reprezentatyviausių treniravimo tekstyne esančių klasterio terminų konteksto pagrindu kuriami atitinkami kontekstiniai šablonai. Trūkstant informacijos, šablonai gali būti kuriami pagal analogiško, tačiau klasteriui nepriklausančio termino kontekstą, esantį treniravimo tekstyne.
5. Tokie sintetiniai tekstynai visų pirma turėtų būti kuriami anglų ir lietuvių kalboms. Kitoms poroms aktualumas yra mažesnis, o medicininių terminų pridėjimas yra gana keblus.
6. Reikalavimai tekstyno apimčiai:
6.1. Turi apimti tris kalbų poras (LT-EN, LT-FR, LT-DE), kiekvienai kalbai sintezuojant ne mažiau kaip 1 mln. lygiagrečių sakinių.
6.2. Kiekvienai kalbų porai turi būti paruošiamos ne mažiau kaip 20 000 įvardintų esybių naudojant ne mažiau 50 kontekstinių šablonų, skirtingų kiekvienai įvardintų esybių kategorijai (ne mažiau 10 kategorijų).
6.3. Sintetinės lygiagrečių sakinių poros su įterptais medicininiais terminai sudaromos tik LT-EN kalbų porai, įterptų terminų skaičius – ne mažiau 1 000 vnt.
6.4. Ne didesnis nei 0,5% rašybos klaidų lygis.
Dokumentavimo reikalavimai:
• turi detaliai apibūdinti Tekstyno struktūra, jo sudarymo ir anotavimo metodikos;
• aprašytos anotacijos ir jų reikšmė;
• pateikta detali statistika įvairiais pjūviais;
• sukurtam produktui turi būti taikomas detaliai dokumentuotas tarptautinis metaduomenų standartas. (pvz., Data Catalog Vocabulary (DCAT) https://www.w3.org/TR/vocab-dcat-3/, Dublin Core Metadata Element Set (DCMES) https://www.dublincore.org/specifications/dublin-core/dces/, The Component Metadata Initiative (CMDI) https://media.dwds.de/clarin/userguide/text/metadata_CMDI.xhtml arba analogiški).
Teisiniai reikalavimai projektui:
Kuriant visus produktus (rezultatus) privalu laikytis:
• autorių ir gretutines teises reguliuojančių Lietuvos ir ES teisės aktų;
• duomenų apsaugą reguliuojančių Lietuvos ir ES teisės aktų;
• dirbtinio intelekto sistemoms rengiamų mokymo duomenų kokybę reguliuojančių Lietuvos ir Europos teisės aktų;
• Lietuvos ir Europos Sąjungos teisės aktų, reguliuojančių atvirų duomenų formavimo ir skelbimo principus. (ES direktyva dėl atvirųjų duomenų ir viešojo sektoriaus informacijos pakartotinio naudojimo BDAR (EUR-Lex - 32016R0679 - EN - EUR-Lex (europa.eu)) https://eur-lex.europa.eu/legal-content/EN/TXT/?qid=1561563110433&uri=CELEX:32019L1024).
Kuriant visus produktus (rezultatus) rekomenduojama atsižvelgti į naujai ruošiamą dirbtinio intelekto aktą (EUR-Lex - 52021PC0206 - EN - EUR-Lex (europa.eu)).
Turi būti parengta ištekliaus naudojimo licencija, kuri užtikrina atvirą ir nemokamą prieigą prie ištekliaus.
Visi surinkti tekstyno įrašai turi turėti atitinkamas licencijas. Tekstynas privalo būti pasiekiamas Lietuvos atvirų duomenų portale (data.gov.lt) ir ne mažiau nei per vieną atviros prieigos platformą (pvz., „Hugging Face“, CLARIN ar kt.) bei prieinamas nemokamai.

Projektas turi atitikti bendruosius projektų atrankos kriterijus, nustatytus Projektų administravimo ir finansavimo taisyklių 2 priede.
Projekto komunikacijos ir informavimo veiksmai atliekami vadovaujantis Projektų administravimo ir finansavimo taisyklių VIII skyriaus „Kiti projektų reikalavimai“ pirmojo skirsnio „Informavimas apie projektą ir komunikaciją“ nuostatomis.
Projektų atranka atliekama valstybės planavimo būdu.
Pagal Aprašą partneriai – nėra galimi.
Horizontaliųjų principų ir kitų nuostatų reikalavimai

Neutralus – projektas negali daryti neigiamo poveikio horizontaliesiems principams.
Projekto įgyvendinimo metu neturi būti pažeidžiami HP: darnaus vystymosi, įskaitant reikšmingos žalos nedarymo principą; lygių galimybių ir nediskriminavimo (dėl lyties, rasės, tautybės, pilietybės, kalbos, kilmės, socialinės padėties, tikėjimo, religijos ar įsitikinimų, pažiūrų, amžiaus, lytinės orientacijos, etninės priklausomybės, negalios ar kt.), įskaitant prieinamumo visiems reikalavimo užtikrinimą (paslaugų, infrastruktūros, fizinės ar e. aplinkos sprendimai, informacijos, transporto prieinamumo ir pan.); inovatyvumo (kūrybingumo). Projekte neturi būti numatyta veiksmų, kurie turėtų neigiamą poveikį įgyvendinant HP.
Projektų atitikties Reikšmingos žalos nedarymo horizontaliajam principui vertinimo reikalavimų aprašas pateikiamas Aprašo 1 priede.
Veikla, vadovaujantis Europos Komisijos 2021 m. vasario 12 d. patvirtintomis Reikšmingos žalos nedarymo principo taikymo pagal Ekonomikos atsparumo ir didinimo priemonės reglamentą techninėmis gairėmis, atitinka reikšmingos žalos nedarymo principą, nes neturi neigiamo numatomo poveikio 6 aplinkos tikslams, nurodytiems 2020 m. birželio 18 d. Europos Parlamento ir Tarybos reglamento (ES) Nr. 2020/852 dėl sistemos tvariam investavimui palengvinti sukūrimo, kuriuo iš dalies keičiamas Reglamentas (ES) 2019/2088, 17 straipsnyje arba numatomas jų poveikis yra nereikšmingas, t. y. nedaro tiesioginio ir pirminio netiesioginio poveikio per visą gyvavimo ciklą.
Projektas neturi pažeisti Chartijos pagrindinių teisių: orumo; asmenų, privataus ir šeimos gyvenimo, sąžinės ir saviraiškos laisvės; asmens duomenų; prieglobsčio ir apsaugos perkėlimo, išsiuntimo ar išdavimo atvejų; teisių į nuosavybę ir teisių užsiimti verslu; lyčių lygybės, vienodo požiūrio ir lygių galimybių, nediskriminavimo ir neįgaliųjų teisių; vaiko teisių; gerojo administravimo, veiksmingos teisinės gynybos, teisingumo; solidarumo ir darbuotojų teisių; aplinkos apsaugos.
Reikalavimai įgyvendinus projektų veiklas

3 metai po projekto įgyvendinimo pabaigos privaloma viešinti projekto įgyvendinimo rezultatus, siekiant užtikrinti sukurtų išteklių populiarinimą.
Projektų įgyvendinimo trukmė

Projekto veiklos turi būti įgyvendintos iki 2026 m. balandžio 30 d.
Projektų bendrieji atrankos kriterijai

Projektų bendrieji atrankos kriterijai nurodyti Projektų administravimo ir finansavimo taisyklių 2 priede. https://esinvesticijos.lt/dokumentai/projektu-bendruju-atrankos-kriteriju-sarasas-ir-ju-vertinimo-metodika-3
Projektų specialieji atrankos kriterijai

-

Teikimo tvarka

Parengtas PĮP (su visais privalomais priedais) teikiamas per 2021-2027 m. Duomenų mainų svetainę (DMS) adresu https://dms.investis.lt. Kilus klausimams kreiptis į nurodytą kvietime atsakingą už kvietimą asmenį.
Kartu su PĮP teikiama

9 priedas: dokumentai ir informacija, pagrindžiantys projekto išlaidų pagrįstumą (pvz., sudarytų sutarčių kopijos, komerciniai pasiūlymai), taip pat pateikiamos nuorodos į rinkoje esančias kainas (pvz., Centrinėje viešųjų pirkimų informacinėje sistemoje) 10 priedas: dokumentai, pagrindžiantys darbo užmokesčio išlaidų pagrįstumą (veiklų sąrašą, kuriame būtų nurodytos projektą vykdančių asmenų darbo pagal projektą valandos, įkainis (valandinis arba mėnesinis), jo pagrindimas). 11 priedas: darbo užmokesčio pažyma (Aprašo 3 priedas)

Programa

Naujos kartos Lietuva
Komponentas

Skaitmeninė transformacija ekonomikos augimui
Atsakinga institucija

Lietuvos Respublikos ekonomikos ir inovacijų ministerija
Administruojanti institucija

Centrinė projektų valdymo agentūra

2024-05-07 Nr. 02-107-P

Aprašas

Kvietimo „Sintetinių lygiagrečių tekstynų sukūrimas“ aprašas

Atsisiųsti DOCX 104.1 KB

Plačiau apie dokumentą ir jo priedus

2024 m. gegužės 08 d.

NaujosKartosLietuva EIMIN

EIMIN: lietuvių kalbos dirbtinio intelekto sprendimams kurti – 12 mln. eurų

Sintetinių lygiagrečių tekstynų sukūrimas Pasibaigęs

Nr. 02-107-P

Virtualus asistentas aktualių kvietimų paeiškai