
El aragonés le habla al futuro: cómo una IA podría salvarlo del olvido
Un equipo de investigadores de la Universidad de Zaragoza trabaja para entrenar modelos de inteligencia artificial en una lengua con apenas presencia digital y en riesgo de desaparecer
En una pequeña sala de investigación de la Universidad de Zaragoza, Miguel López Otal, filólogo e informático vocacional de 27 años, se enfrenta a un reto tan técnico como simbólico: lograr que la inteligencia artificial aprenda a “hablar” en aragonés.
Ante la duda de si una IA puede ser archivo de resistencia cultural o si es posible enseñar a un modelo neuronal una lengua que apenas existe en internet, López Otal trabaja para que esta lengua minorizada durante siglos se proyecte hacia el futuro. Para él, alcanzar esta meta ayudaría a que “una lengua minoritaria pueda conseguir perdurar en el tiempo e incluso modernizarse”, de tal forma que tampoco “sucumbiera al olvido y se proyectara al futuro como reservorio cultural”
“Y es que la historia, por diferentes causas, ha sido cruel con algunas modalidades lingüísticas, que se han visto relegadas y perjudicadas de tal forma que han acabado desapareciendo”, sostiene el joven, premiado en la VI Jornada I3A por este mismo proyecto.
Sin embargo, advierte que eso solo es posible si cuenta con un mínimo caudal de producción lingüística y literaria. “El gran problema es la escasez de datos”, explica Miguel, ya que “las máquinas aprenden a partir de grandes cantidades de textos, y en aragonés eso es un obstáculo enorme”. No obstante, a pesar de las referencias y de la falta de un uso generalizado de la lengua, asegura que “no es imposible”.
Por ello, considera este proyecto no solo como un desafío tecnológico, sino un compromiso con la cultura: “La IA puede ser una herramienta para mantener vivo un idioma que está en riesgo, que no tiene presencia digital y que necesita una modernización para atraer a los jóvenes”.
Cómo se inicia esta investigación
Según recuerda López Otal, es un “cúmulo de casualidades”, así como de distintos proyectos en los que se ha visto involucrado a lo largo de sus años de formación y profesionalización.
En un primer momento, recuerda estar fascinado por la idea de entrenar modelos de IA para lenguas minoritarias e incluso ficticias, como el quenya, idioma élfico de Tolkien. Por otro lado, afirma que se involucró ya hace un tiempo con el aragonés cuando participó, con la extinta Dirección General de Política Lingüística de Aragón, en un proyecto para traer tecnologías lingüísticas a esta lengua.
“Quise unir esas ideas, por un lado, como una oportunidad técnica para explorar las capacidades y límites de estos modelos con lenguas minoritarias. Por otro, como reivindicación cultural de esta lengua”, destaca. Respecto a la Inteligencia Artificial, sostiene que es una “caja negra”, un modelo del que “no se sabe muy bien cómo funciona por dentro” porque se introducen unos datos y genera otras respuestas.
Miguel López Otal recibe su premio por este proyecto
Del mismo modo, asegura que se conoce cómo están implementadas estas herramientas materialmente, pero no cómo consiguen llegar a sus resultados finales.
El investigador del programa Ramón y Cajal y tutor del proyecto, Jorge Gracia, explica que la investigación se centra en entender cómo procesan los modelos del lenguaje la información lingüística en su interior y, en base a ello, estudiar cómo “transferir” las capacidades de un modelo de lenguaje entrenado en una lengua mayoritaria a otra lengua minoritaria.
“La idea es poder crear modelos que requieran una menor cantidad de datos de entrenamiento, lo cual es siempre un obstáculo para desarrollar modelos en las lenguas minoritarias”, detalla.
La situación del aragonés
Gracia comparte esta visión: “El aragonés está en una situación delicada”, comenta, por lo que el siguiente paso es hacer que la lengua “viva en el día a día”. “Eso pasa por darle una presencia actual en las nuevas tecnologías”.
Ambos coinciden en que la tecnología puede convertirse en una aliada decisiva para el futuro de las lenguas minorizadas, aunque advierten que “no basta” con crear un modelo de IA, sino que es necesario que la comunidad hable, escriba y comparta en aragonés.
“Si no hay textos ni conversaciones, la IA no podrá avanzar ni el sistema podrá aprender y mejorar”, apunta Miguel, a lo que Jorge suma que “estos modelos necesitan una enorme cantidad de textos para ser entrenados”, situación que favorece a las lenguas mayoritarias frente a las minorizadas como el aragonés.
Según el libro ‘Charrando aragonés: La lengua aragonesa en su zona de uso predominante’, unas 24.000 personas entienden, hablan, escriben y leen en aragonés, de las que el 25% serían consideradas hablantes activos. Más en concreto, se calcula que unas 8.000 personas utilicen esta lengua de manera cotidiana, ya sea en pequeñas localidades o en contextos familiares y vecinales.
A pesar de que estos datos reflejan que el aragonés sobrevive en entornos rurales y de montaña, sobre todo en comarcas como Sobrarbe, Ribagorza, Alto Gállego o Jacetania, en Zaragoza ciudad, aunque no forma parte del área tradicional hablante, hasta 7.000 personas declaran hablar aragonés.
No obstante, la UNESCO la clasifica como una lengua “definitivamente en peligro” y diversas plataformas han alertado de que el descenso generacional en su uso es “pronunciado”. En los últimos años, iniciativas educativas y culturales han intentado frenar su desaparición, pero el salto digital sigue siendo una asignatura pendiente.
Un reto en mayúsculas
Pese a ser un camino complejo, ambos confían en que el esfuerzo será recompensado. “Imaginamos un futuro en el que un asistente virtual pueda entender y responder en aragonés, en el que la lengua esté presente en redes sociales, aplicaciones y dispositivos”, reconoce López Otal, quien añade que “eso es lo que puede hacer que la lengua se mantenga viva, que se use y se valore”. También subraya otro uso potencial: “En el peor de los casos, si la lengua desaparece, al menos se podría tener una IA que sea capaz de hablarla, para mantenerla en el recuerdo, como un loro que repite frases de una lengua muerta”.
Al mismo tiempo, López Otal comparte que hay un gran número de investigaciones en las que ya se plantean maneras de entrenar IAs en lenguas peninsulares distintas al castellano, siendo el Barcelona Supercomputing Center un claro ejemplo de ello.
No obstante, como ocurre en toda investigación, Miguel afirma que “hay resultados prometedores, pero preliminares”. “Estamos mirando si podemos integrar conocimiento léxico específico o de reglas gramaticales concretas en modelos ya entrenados en castellano, para ver si podemos adaptarlos a la lengua aragonesa”, comparte.
Pero, aunque apunta que el objetivo final es crear una IA en aragonés, acepta que hay que ir “poco a poco” e ir probando experimentos que “están dando algunos frutos con los que estar ilusionados”.
Y, aunque se mantienen firmes y confiados, el investigador asiente que es “una carrera en solitario y contra obstáculos tales como la falta de reconocimiento social o institucional”, por lo que “esto hace mella constantemente”. Aún así, asegura que se ve recompensado por el carácter voluntarioso de muchos lingüistas y hablantes de aragonés, que “siempre están dispuestos a echar una mano por la preservación de la lengua”.
En este sentido, la inteligencia artificial no solo sería un reflejo del presente, sino un motor para que el aragonés recupere protagonismo y se adapte a las nuevas formas de comunicación porque, así lo reconoce, “la existencia de IAs generativas en aragonés puede favorecer la creación de más y más contenidos en esta lengua”.
Asimismo, para López Otal, no hay que olvidar que “una lengua siempre es una riqueza, un patrimonio cultural inmaterial para aquellos que la usan y para aquellos cuyos antepasados hicieron uso de ella”. Y, por eso, hay que seguir investigándola y adaptándola a cada tiempo.