La palabra “gaceta” aparece por primera vez en Gipuzkoa en un documento del siglo XVII. Su sinónimo “periódico”, en cambio, se encuentra en otra acta del siglo XIX. Esta búsqueda, en otro periodo de la historia, implicaría que un investigador interesado se desplazase hasta los Archivos de Tolosa u Oñati y que llevase a cabo una búsqueda que le llevase semanas o meses. Ahora, la Diputación Foral de Gipuzkoa ha habilitado el servicio Ipuscuako Agiriak, un buscador accesible a la ciudadanía basado en tecnología de inteligencia artificial que permite la lectura de documentos manuscritos, que permite bucear en 220.000 actas de las Juntas Generales y las Diputaciones de Gipuzkoa desde el siglo XVI hasta mediados del siglo pasado.
La diputada de Cultura, Goizane Álvarez, el jefe de Servicio de Archivos y Patrimonio Documental, Ramón Martín, la responsable del Archivo General de Gipuzkoa, Maider Etxagibel, y el representante de la empresa Transkritorium, Luis Morró, han presentado este lunes las novedades de este servicio que, según han comentado, tiene vocación de continuidad y se irá ampliando con el tiempo. Ipuscoako Agiriak es una iniciativa que se enmarca dentro de las actividades por la celebración de los mil años desde que el topónimo Guipuzcoa fuese registrada por primera vez en un documento.
Si bien el buscador actual permite el análisis de más de 200.000 documentos digitalizados, Martín ha aclarado que sería prácticamente imposible hacer esto con todos los archivos que guardan las administraciones del territorio “con los medios y los presupuestos actuales”. No en vano, la suma de los fondos de los archivos forales superan los 25 kilómetros de longitud de estanterías ocupadas. “El uso de la inteligencia artificial tiene que ser lógico. Tiene que se usarse sobre el tipo de documento necesario”, ha explicado el jefe de servicio. ¿Y cuáles son dichos documentos? Las actas desde 1550 hasta 1948, a excepción de dos periodos: 1650-1700 y 1840-1887. “Gipuzkoa desde sus inicios ha recogido sus actas con cuestiones del momento. Albergan información muy interesante en un formato de difícil lectura -el manuscrito-”, ha añadido. No en vano, los manuscritos exigían una lectura lineal y hoja a hoja -las actas, de los más variadas, se acumulan una detrás de otra y no sé clasifican por temática o expediente-.
Inteligencia artificial estadística
La historiadora Rosa Ayerbe durante 34 años de trabajo exhaustivo ha completado la transcripción de 25.000 documentos del siglo XVI y el XVII. Con la llegada de esta herramienta, ha asegurado Martín, se da un enorme salto.
Como la mayoría de las inteligencias artificiales, la que la Diputación ha aplicado a esta iniciativa también se basa en el machine-learning. Se ha facilitado a las IA varios documentos originales y sus transcripciones y con estos ha ido aprendiendo. El proyecto se ha estructurado en varias fases. En la primera se han tratado 195.000 imágenes de actas manuscritas de los siglos XVIII al XX; en la segunda se han incorporado las 25.000 páginas transcritas de los siglos XVI y XVII; y actualmente se desarrolla una tercera fase centrada en las actas impresas de la segunda mitad del siglo XIX y del XX.
No obstante, los resultados no son al 100% eficientes, dado que Ipuscoaco Agiriak lo que hace es una indexación probabílistica de resultados. Es decir, haciendo una lectura de los textos, devuelve una serie de resultados en función al porcentaje de probabilidad de que el término manuscrito y el buscado sean el mismo. “La inteligencia artificial es impresionante, pero no es inteligente. Tiene una gran capacidad de cálculo pero hay que alimentarla: no sabe nada de cero. De hecho, no llega ni de lejos a la capacidad que tiene de interpretación el ser humano”, ha añadido el jefe de servicio.
Ipuscoaco Agiriak es un servicio complementario al servicio Gipuzkoako Artxibo Ataria, que desde 2016 reúne más de 800.000 registros descriptivos y cuatro millones de imágenes de documentos conservados en archivos forales.