Desenvolupar coneixement en intel·ligència artificial (IA) sobre nous models de llenguatge generatius aplicables a les llengües amb pocs recursos dels dos costats dels Pirineus (català, occità, aragonès i basc) és l’objectiu del projecte europeu LINGUATEC IA, on participen investigadors de la Universitat de Lleida (UdL).
Liderat per Elhuyar i cofinançat per fons FEDER, pretén avançar en la digitalització d’aquestes llengües i en la construcció d’una infraestructura lingüística i intel·ligent transfronterera que faciliti la comunicació. El processament del llenguatge és una poderosa eina per a les comunitats lingüístiques amb escassos recursos que ajuda a revitalitzar la llengua, per tant és important treballar en intel·ligència artificial per no quedar-se enrere.
És per això que totes les entitats que formen part del projecte ja han començat a treballar en diferents àmbits relacionats amb el processament del llenguatge. També en la millora dels sistemes de transcripció, traducció automàtica neuronal i síntesi de veu del basc, català, occità, aragonès i les seues variants dialectals que combinin amb el francès i l’espanyol, el desenvolupament d’una plataforma lingüística multilingüe de subtitulació i doblatge automàtic. “Hem previst crear una plataforma en línia amb tots els recursos, tecnologies i aplicacions que desenvolupem per a les llengües dels Pirineus”, explica Josu Aztiria, coordinador de LINGUATEC.
Pel que fa a la UdL, l’equip, integrat per Jordi Suïls, Glòria Vàzquez i Helena Torres, s’ocuparà de millorar les eines de traducció automàtica català-aranès de crear un corpus digitalitzat per a l’aranès, tant de llengua escrita com oral, per tal d’ajudar a construir processadors i sintetitzadors de llenguatge oral.