El sector de los contenidos digitales está experimentando un crecimiento imparable en los últimos años. La transformación digital, la constante evolución tecnológica, la mejora en las infraestructuras de telecomunicaciones, la crisis del coronavirus y los nuevos hábitos de consumo, entretenimiento y comunicación, han disparado la generación y uso de los contenidos por Internet. Siguiendo el Informe Anual del Sector de los Contenidos Digitales1, en 2020 todas las actividades vinculadas al sector han crecido respecto al año anterior, incluyendo el consumo de contenidos audiovisuales bajo demanda por Internet, que ya lo realiza el 55,1% de las personas en el Estado; ver televisión online (el 46,7%); el uso de plataformas de comunicación (del 55,1% al 77,7%); la lectura de noticias, periódicos o revistas digitales de actualidad (del 71,1% al 75,9%) o el consumo de contenidos educativos (del 24,1% al 35,1%), entre muchos otros.

Es evidente que las nuevas tecnologías de la información han creado un entorno digital, multimodal y multimedia perceptible prácticamente en cualquier sector y actividad económica. Este aspecto, unido a los avances tecnológicos en áreas como la Inteligencia Artificial (IA) aplicada al procesamiento y generación de nuevos contenidos digitales, ha hecho crecer las posibilidades de contar con un contenido cada vez más rico, variado y accesible, generando una demanda muy alta en el mercado por disponer de soluciones que automaticen estos procesos de generación y mejoren y amplíen la experiencia de usuario.

Siete empresas

El consorcio de STREAMS engloba a 7 empresas (Haiko, Jarkatza, MondragonLingua T&C, Goiena Komunikazio Taldea, Mixer Servicios Audiovisuales, NOTICIAS DE GIPUZKOA, Onda Vasca) que aportan servicios y soluciones TIC relacionadas con los contenidos digitales en múltiples sectores; entorno corporativo y empresarial, administración pública, producción audiovisual y comunicación (prensa, radio y televisión).

En todas ellas, se ha detectado la necesidad de incluir tecnología IA avanzada en sus procesos y soluciones que permita, mediante métodos automatizados de transcripción, síntesis y traducción neuronales, generar y/o enriquecer sus contenidos para potenciar y añadir un valor diferencial a sus ofertas y soluciones actuales.

Objetivos del proyecto

Objetivos del proyectoEl objetivo principal de STREAMS es el desarrollo de una plataforma en la nube que incorpore servicios IA conectados de transcripción, traducción, subtitulación automática y síntesis del habla en múltiples idiomas (euskera, castellano, francés e inglés), dirigidos a mejorar y aportar un valor añadido y diferencial a los procesos y soluciones actuales de las empresas en sus múltiples sectores de aplicación. Será un proyecto en el que, además de contar con actividades I+D de alta complejidad tecnológica en relación a los métodos, componentes y modelos IA a generar, se

trabajará intensamente en desarrollar una solución que permita una integración sencilla de todas sus funcionalidades en los procesos y soluciones actuales de las empresas, que aportan una gran variedad de casos de uso y necesidades (ver sección 2.1.4).

STREAMS está dirigida a proveer y posibilitar flujos ágiles y dinámicos de transmisión y generación de información, siendo crítica la correcta resolución en diferentes escenarios de aplicación, tanto streaming (procesamiento en tiempo real) como micro-batching (procesamiento en pequeños lotes de ficheros).

En suma, en el proyecto STREAMS se desarrollará una solución única e innovadora en el mercado, orientada a implementar servicios IA multilingües de transcripción, traducción, subtitulación y síntesis de voz para flujos de información de audio y texto en streaming micro-batching que posibilitarán la generación de múltiples aplicaciones a las empresas, como la transcripción interactiva en diferentes idiomas, sistemas de búsqueda e indexación de audio, accesibilidad mediante subtitulación multilingüe de calidad, generación y lectura de noticias con habla sintética, enriquecimiento del doblaje, traducción de documentos y guiones, entre otras posibilidades y casos de uso detallados más adelante en esta memoria.

Para conseguir estos objetivos, en STREAMS se realizarán actividades I+D punteras en tecnología neuronal del habla y de traducción automáticas con el ánimo de potenciar la competitividad de las empresas en el sector de contenidos digitales y audiovisuales, promoviendo su innovación a través del desarrollo de una solución diferenciadora.

El consorcio de STREAMS está liderado por HAIKO, que cuenta con la solución propietaria NIREStream6, plataforma de video streaming para el Entorno Corporativo y Empresarial que quiere potenciar con los servicios de STREAMS. El consorcio también lo componen productoras como Jarkatza, que ofrece servicios de producción, grabación, realización de eventos online y streaming personalizados, así como Mixer, cuya actividad está principalmente centrada en la subtitulación y doblaje en euskera y castellano. Por su parte, Mondragon Lingua es una de las empresas líder en España en el ámbito de la provisión de servicios lingüísticos, que comprenden la formación en idiomas, la traducción e interpretación. Por último, en el ámbito de la comunicación se sitúan Goiena, que ve el valor de STREAMS tanto para enriquecer con transcripción y subtitulación multilingüe la solución de videoactas que ofrecen a diversos ayuntamientos como para añadir servicios avanzados en su espacio web, NOTICIAS DE GIPUZKOA y Onda Vasca, cuyo interés en el proyecto se centra en la transcripción y síntesis de habla para euskara y castellano.