Los traductores neuronales y la Wikipedia en euskera, cuyo uso se han disparado en los últimos años y son usados hoy en día por “miles y miles” de personas en Euskadi, son sólo el comienzo, la punta del iceberg de una faceta tecnológica de nuestra lengua, que avanza sin complejos hacia un futuro que los expertos aseguran ya sin tapujos que estará dominado por “la voz y la Inteligencia Artificial”.
Tras más de 20 años de investigación y trabajo en “auzolan”, la comunidad euskaldun cuenta hoy con redes sociales íntegramente en euskera e interconectadas entre sí, software libre, traductores autómaticos y otras muchas herramientas que eran impensables hace unos años y nos equiparan a otras comunidades lingüísticas de mucho más peso.
Uno de los principales retos ahora es hacer que las máquinas entiendan nuestro idioma, lo aprendan, y que no tengamos que decirle a nuestro televisor Open Netflix, o Ponme música. Una especie de Siri o Alexa en euskera, sin tener que cambiar de registro o limitar el euskera a determinados ámbitos. La irrupción de la Inteligencia Artificial ha marcado un antes y un después.
“No podíamos dejar escapar esta ola”, reconoce Miren Dobaran, la viceconsejera de Política Lingüística del Gobierno Vasco, quien asegura que Euskadi tiene que continuar con “una investigación que, o hacemos nosotros, o las grandes firmas tecnológicas no van a hacer”: “Si tengo que hablar con Siri o con un call center en castellano porque no me entiende en euskera, es decir, si nuestra lengua no sirve para el día a día, se va a quedar rezagada. O lo hacemos nosotros, o no lo hará nadie”.
En su opinión, Euskadi está bien posicionada” en esta carrera tecnológica hacia el infinito, en la que si te duermes, “te quedas atrás enseguida”. La apuesta del Ejecutivo vasco es clara y se apoya en el “impulso de nuestra comunidad lingüística, que es muy fuerte y activa”.
Dobaran asegura que los datos de utilización del traductor neuronal Itzuli y la Wikipedia en euskera son “espectaculares” y van a más. Lo utilizan “miles y miles de personas entre lunes y viernes, y el fin de semana baja, lo que indica cuándo y cómo se utiliza. Los usuarios somos los que trabajamos y los estudiantes”.
Hoy en día el traductor neuronal “funciona muy bien en el ámbito administrativo”, y “ahora se está trabajando en uno específico para salud, y “se irá extendiendo e iremos teniendo traductores neuronales bien entrenados en varias disciplinas”, afirma la viceconsejera.
El salto tecnológico que ha propiciado la Inteligencia Artificial es evidente. “Nos dimos que cuenta de que los datos son oro y que, o amoldábamos la IA al euskera, o no había nada que hacer. Y decidimos apostar por ello. Vimos que con los sistemas automáticos la comunicación sería mediante voz, es decir, matemática, y si queremos que nos entiendan, hay que entrenarlos”. Es lo que pretende la iniciativa Gaitu.eus, en el que cualquier ciudadano o ciudadana puede, de forma voluntaria y sin compromiso, ayudar a aumentar el corpus lingüístico con el que trabaja la Inteligencia Artificial.
El Gobierno Vasco se ha sumado a esta iniciativa aportando todo su banco de datos, y asegura Dobaran que el objetivo es poner todo ese corpus lingüístico a disposición de las empresas que estén interesadas en incorporar el euskera en sus herramientas automáticas. “Eso sí, tendrá que decirnos para qué lo quiere”, precisa.
Máquinas que “nos lo leen”
En Donostia nos atiende Itziar Cortés Etxabe, coordinadora de lenguaje y tecnología de Elhuyar, que esta misma semana ha dado a conocer que Elia, el traductor automático que puso en marcha hace cuatro años, ahora también tiene voz y tecnología TTS que permite escuchar las traducciones que propone. Es un paso más en una trayectoria de más de 20 años de investigación de esta firma . Así, además de pedirle la traducción de un texto a Elia, “podemos ordenarle que lo lea y escuchar la traducción que nos propone en las voces neuronales desarrolladas por Elhuyar”.
Por otro lado, Elia se ha integrado en Telegram y los mensajes que se reciben mediante esta aplicación de mensajería instantánea pueden traducirse a cualquiera de las seis lenguas que ofrece Elia. Los datos de uso avalan este esfuerzo desarrollador de Elhuyar. La web Elia.eus ha recibido este año un 33% más de visitas que en 2022 y el número de usuarios ha crecido un 12%. Cortés Etxabe asegura que “el desarrollo de estas tecnologías ha sido muy grande en los últimos cinco años”. Hace quince años proyectos experimentales de traducción automática ofrecían “resultados muy limitados, con frases cortas y un diccionario limitado”. Y recuerda que hasta hace no mucho, para enseñar a las máquinas a traducir, “era necesario tener lingüistas” alimentando el sistema automático y enseñándole euskera: “Había que definir el idioma”.
Hoy, sin embargo, mediante la IA, la máquina “aprende sola”, pero es necesario “seguir con la investigación para alimentar los sistemas con nuevos avances” y “crear modelos propios para garantizar la calidad del euskera” empleado, algo complicado si lo hacen en San Francisco.
Por otra parte, la calidad en la generación de voz automática también ha mejorado mucho. “Antes sonaba muy robótico, y ahora puedes escuchar voces muy naturales”. Máquinas o sistemas que pueden imitar la voz de una persona de forma automática.
Elhuyar también ha hecho una “apuesta muy firme por la IA, y hemos creado productos partiendo de nuestra labor investigadora”, afirma Cortés Etxabe. Orai es el espacio de trabajo de Elhuyar basado en la IA. Una herramienta esencial para seguir avanzando en el futuro.
Redes sociales “saludables”
Sin sellos ni marcas trabajan decenas de técnicos e informáticos euskaldunes agrupados en Librezale Elkartea, un grupo de voluntarios que llevan 25 años luchando por incluir el euskera en las nuevas tecnologías e impulsando al mismo tiempo en software libre.
Marko Txopitea es uno de ellos. “Queríamos que el euskera estuviese presente en las herramientas que utilizábamos. Y veíamos que las empresas llevaban su camino, pensando en sus mercados, y estaban dejando de lado el euskera. Y empezamos a traducir software libre”. Comenzaron con productos de Mozilla, el navegador Firefox, luego el correo electrónico Thunderbird, el editor de textos Wordpress y el paquete ofimático Libreoffice. “O lo euskaramos nosotros, o no lo hará nadie”, se dijeron.
“Ahora estamos impulsando que se use el software libre en los centros educativos”, dice Txopitea, lo que reporta “otros valores a los jóvenes y no crea dependencia”, ya que gigantes como Google o Microsoft lo que buscan con el desarrollo de sus herramientas es “crear dependencia en sus clientes”.
Las redes sociales son otro foco. Marko Txopitea es también miembro de Abaraska taldea, un colectivo que propugna e impulsa redes sociales euskaldunes. Existe, de hecho, un “universo” que interconecta todas estas redes sociales, justas, libres y saludables, no adictas.
En ese universo federado, Twitter tiene su propio sustituto, Mastodon, una red social con muchos servidores en el que cada comunidad gestiona el suyo, y agrupa a millones de usuarios. “Mastodon.eus es la nuestra, íntegramente en euskera. Y Pixelfed es el equivalente a Instagram. Hay otras herramientas como Paperjale.eus, para compartir críticas de libros, sustituo de Goodread. Todas estas redes alternativas te permiten interactuar unas con otras, es decir, se puede seguir desde una cuenta de Mastodon a otra de Pixefeld. Es un arnasgune digital en el que vivimos más tranquilos”, dice Txopitea.