El nuevo coordinador de datos de Biogipuzkoa participó el pasado día 16 como ponente en la jornada Datuak X Osasuna, iniciativa surgida de Biogipuzkoa y fruto de la colaboración con el Donostia International Physics Center (DIPC), el Consejo Social de Donostia-San Sebastián y Medialab Tabakalera.

¿Cuál es el papel que juegan los datos en la investigación sanitaria y en qué momento estamos ahora?

–Los datos son la materia prima de la investigación sanitaria. Bien para el estudio biológico de la enfermedad, para mejorar la salud individual mediante herramientas de diagnóstico, optimizar el sistema para mejorar los procesos, puede ser para definir las políticas públicas, para predecir una pandemia o el desarrollo de dispositivos médicos junto al ecosistema industrial. Las aplicaciones son muchas.

¿Cómo se regula todo esto?

–En cada caso se aplica lo que dice la legislación vigente y las buenas prácticas definidas por la Asociación Española de Protección de Datos (AEPD) y, en nuestro caso, por Osakidetza y el Departamento de Salud (Aprobación de comité éticos, Evaluación de Impacto relativa a la Protección de Datos, Plan de Gestión de Datos, nivel de privacidad o de protección). Y con la nueva regulación Espacio Europeo de Datos de Salud (EEDS), que se ha puesto en marcha el 26 de marzo de este año, se va a armonizar en Europa la forma de trabajar en el uso secundario de los datos de salud y relacionados, tratando de facilitar su uso para aprovechar las oportunidades de innovación dentro del contexto regulatorio Europeo. 

¿Qué son esos datos de uso secundario que tanto pueden aportar?

–La tipología de uso de los datos de salud se divide en dos: el uso primario se define como el tratamiento de datos de salud para la prestación de asistencia sanitaria (evaluar, conservar o mejorar la salud de la persona) de salud. Y ahí se intenta impulsar, simplificando, que si tú vas al médico en Alemania o Finlandia, con un QR, un médico finlandés pueda tener disponible tu historial médico para poder atenderte mejor. Y los datos secundarios son todos aquellos datos de salud y relacionados que estén disponibles y se utilicen para un propósito que no es original. Por ejemplo, investigación o definición de políticas públicas.

“Los datos tienen capacidad para revolucionar la salud. Pero primero hay que pensar en los objetivos y las necesidades”

¿Cómo se consiguen estos datos?

–Hay muchas fuentes de datos de salud, y/o relacionados con la salud: datos clínicos y sanitarios, datos de salud y bienestar, de investigación molecular y genómica; datos de exposiciones ambientales, como calidad del aire, el ruido; y luego factores sociales, como el nivel socioeconómico y la educación. Por ejemplo, se puede ver qué efecto tiene el nivel socioeconómico en la obesidad; o de animales en la salud humana y viceversa, en enfoque One Health. Luego está la finalidad de uso de los datos y hay muchas tipologías de proyecto: ensayos clínicos, proyectos de investigación, etcétera. Hay algunas fuentes que están recogidas en Osakidetza (datos públicos asistencial), en cohortes de investigación de Biogipuzkoa, en Open Data Euskadi, en servicios de proveedores de aplicaciones de bienestar, Eustat, etc. 

¿Quién controla todo eso?

–Lo que se plantea en la nueva regulación EEDS es crear Organismos de Acceso a Datos Sanitarios, unos entes públicos que habrá en cada país. La regulación plantea que pueda haber uno o varios en cada país miembro, parece que habrá uno en cada comunidad y Euskadi se está preparando.

No estamos hablando solo de los datos de Osakidetza

–En el mundo sanitario hay mucha información. Si tú vas a hacerte un test genético a una clínica privada, o de intolerancias, al final ahí hay datos de salud tuyos. Eustat tiene datos de mi pueblo, Zumaia, y del resto. O cuando voy a un dentista o un fisioterapeuta. Lo que se quiere es abrir el abanico. Y lo que plantea la nueva regulación es que todos estos profesionales, el dentista o el médico deportivo cuando me hago una prueba de esfuerzo, estén obligados a hacer sus datos disponibles.

¿Obligados a ceder esos datos?

–Bueno, hay algunas limitadas excepciones. Pero el concepto es ese: tú como tenedor de datos estarás obligado a informar y hacer esos datos disponibles a los organismos de acceso. Y esos organismos de acceso tendrán sus catálogos y valorarán cada petición de acceso, de origen europeo. Entonces, el que quiere utilizar esos datos, toca la puerta de este organismo de acceso, presenta su proyecto, indica qué objetivos tiene, y es el organismo público de acceso el que valora el aspecto ético, la privacidad requerida y prepara esos datos; y le pide a quien tiene los datos que se los haga disponibles. Y un aspecto importante de la regulación es que los datos no se descargarán en ningún caso, sino que se va a habilitar un espacio en el que el investigador entrará en un entorno seguro de tratamiento y tendrá que hacer ahí sus análisis. Eso es lo que viene. 

¿Cómo de maduro está todo esto?

–Han hecho unos pilotos, pero viene un cambio grande y las funcionalidades principales tienen que estar operacionales en menos de cuatro años (26 de marzo de 2029) . En general, esta regulación nos da más posibilidades de tratamiento. Lo que se pretende es sacar el potencial que tiene los datos de una forma regulada. En este sentido, el objetivo de la jornada fue mostrar a la gente que hoy en día esto se hace de forma regulada y que la nueva legislación ayudará mucho. Y que la sociedad debería tener la oportunidad de participar en varios de estos procesos. En el uso primario también se abre la oportunidad de que el paciente vea qué información se está incorporando a su carpeta, y poder revisarlos. O tus test genéticos, o datos del reloj inteligente, esos datos los puedes coger y añadirlos al sistema, si bien hay que distinguirlos claramente de los proporcionados por profesionales sanitarios.

“En el Hospital Donostia ya se está utilizando una herramienta de IA para apoyar a los radiólogos en la lectura de mamografías”

¿En qué áreas incide más Biogipuzkoa en el tratamiento de datos?

–La oncología es, sin duda, una de las áreas con mayor oportunidad y donde más estamos trabajando nosotros, especialmente tras la fusión de Onkologikoa con el sistema sanitario público, concentrando recursos y conocimiento en un mismo espacio. Esto nos coloca en una posición estratégica para impulsar proyectos de investigación en cáncer con gran impacto clínico y también social. Pero no es la única. Gipuzkoa también está desarrollando líneas muy relevantes en neurociencias, envejecimiento y terapias avanzadas, áreas donde el análisis de datos puede marcar una gran diferencia en diagnóstico, pronóstico y personalización de tratamientos. Además, trabajamos en el marco de One Health, donde la integración de la información biomédica con otras bases de datos ofrece visión global, y abre nuevas oportunidades para anticipar riesgos y diseñar intervenciones más efectivas.

¿Qué podemos esperar de esta tecnología en el futuro? ¿Arroja ya arroja resultados sólidos?

–Ya hay dispositivos en el mercado que tienen los certificados correspondientes por la FDA y/o con el marcado CE. La mayoría son soluciones de radiología, seguidos por dispositivos cardiológicos. Y ya arrojan resultados sólidos que son aplicables en procesos asistenciales como soporte del profesional, pero aún no se ha desarrollado todo su potencial, bien por la necesidad de estudiar su incorporación a los sistemas sanitarios (coste versus beneficio, aceptación cultural), y bien por las nuevas tecnologías de IA generativa, que hacen pensar en un mayor potencial, con sus riesgos asociados. 

¿Algún ejemplo de cómo los datos o predicciones arrojados han influido ya en tratamientos o decisiones médicas en Gipuzkoa?

–Sí, ya tenemos algunos ejemplos concretos en Gipuzkoa. En el Hospital Donostia se está utilizando una herramienta de IA para apoyar a los radiólogos en la lectura de mamografías, que ayuda a detectar lesiones de manera más temprana y precisa. También se están desarrollando aplicaciones móviles, como Step Oncology, que permiten predecir complicaciones en pacientes oncológicos y dar una respuesta más rápida y personalizada. Más allá de esos casos, lo importante es que ahora mismo hay un gran esfuerzo en marcha: múltiples proyectos de IA y análisis de datos que están siendo validados y que en los próximos años tendrán cada vez más impacto en los tratamientos y en la toma de decisiones médicas en nuestro entorno. 

¿Cómo de fiables son los resultados que arroja el tratamiento de datos?

–Hay metodologías y métricas definidas para evaluar la fiabilidad de las soluciones basadas en datos y antes de ser utilizadas para el proceso sanitario asistencial requieren superar las certificaciones correspondientes. Además, se están investigando y desarrollando aproximaciones para verificar la validez de los modelos IA con el paso   del tiempo y asegurar su fiabilidad, mediante técnicas que buscan la explicabilidad, acotar el rango de uso válido y protecciones del modelo frente a ataques maliciosos (si bien normalmente estos son desplegado en entornos controlados).

¿Los datos tienen la capacidad de revolucionar la salud?

–Para mí, sí. Los datos tienen capacidad para revolucionar la salud. Pero primero hay que pensar en los objetivos, las necesidades, y luego buscar los datos adecuados para lograr ese objetivo. Entonces, puede ser que tengas mucha información sin estructurar, descrito en lenguaje natural, o un montón de imágenes sin sacar los biomarcadores o no lo suficientemente anotados. Ahí puede haber unos procesos que, una vez identificada la necesidad y qué datos necesitas, intentarás ver cuáles tienes, qué calidad tienen y si es necesario mejorarlos. 

¿Para estructurar todos esos datos la IA es fundamental?

–La IA desde luego es una técnica ideal para automatizar los procesos de preparación de los datos. En algunos casos puede ser que un sistema tenga ya datos estructurados. Es decir, igual Osakidetza lo tiene estructurado de una manera para asistencia, pero luego si tú quieres utilizarlo para trabajar conjuntamente en Europa o investigar, igual tienes que prepararlos, armonizarlos e integrarlos. Necesitas un formato de datos y calidad comparable.

“La nueva regulación plantea que el dentista o el médico que te hace una prueba de esfuerzo estén obligados a tener sus datos disponibles”

¿Qué me dice del ordenador cuántico de IBM, el desarrollo de la computación cuántica y el ecosistema científico de Donostia?

–Lo más importante es la colaboración. En Gipuzkoa contamos con un ecosistema científico y tecnológico de primer nivel, en el que Biogipuzkoa aporta la visión biomédica y clínica, y otros agentes aportan sus capacidades tecnológicas y de cálculo. Un ejemplo concreto es nuestro nodo de computación dentro del Donostia International Physics Center (DIPC), que además nos permite acceder a infraestructuras punteras. La biología está entre las áreas donde se espera un gran impacto de la computación cuántica, y el ámbito de la salud tiene un gran potencial. Además, hemos firmado un acuerdo marco de colaboración con el DIPC y cuatro centro tecnológicos: Tecnalia, Vicomtech, Cidetec y Tekniker para impulsar proyectos de innovación conjuntos. Y en este camino, queremos que las personas comprendan cómo se usan sus datos, qué beneficios pueden generar y qué retos éticos plantean. Colaborar entre centros científicos y tecnológicos es esencial, pero hacerlo también con la sociedad es lo que realmente permitirá que los avances en IA o computación avanzada se traduzcan en una mejor salud para todos.

¿A usted ya no le impresiona nada de lo que pueda venir?

–Seguro que llegará algo que lo haga, porque quién iba a imaginarse algo como Chat GPT. Yo estaba en el departamento de salud digital y tecnologías biomédicas de Vicomtech, donde he trabajado 18 años. Era responsable de la línea de investigación Big Data en biomedicina. Hasta hace bien poco la tecnología Deep Learning estaba permitiendo llegar a aplicaciones sanitarias de clasificación asombrosas, por ejemplo en el ámbito de diagnóstico por imagen, pero la reciente incorporación tecnologías de IA generativa está habilitando saltos muy grandes y seguro que nos volverán a sorprender a futuro con la apuesta que se está haciendo en IA a nivel mundial.

¿Esto es una carrera contra China y EEUU?

–Es cierto que en Europa está el debate de siempre, de si nos quedaremos atrás porque somos más garantistas con la regulación. Pero este es un gran paso en nuestra filosofía y en función de las necesidades vitales. En mi charla hablé de oportunidades y retos. Ha habido casos de brechas de seguridad importantes y conocidos en sistemas privados de EEUU y Reino Unido. La cosa es que hay un montón de datos y posibilidades, pero ¡cuidado! Hay diferentes tenedores de datos que tendrán que tener los datos disponibles en el EEDS, con un marco de gobernanza, con protección de datos, calidad de datos, privacidad y transparencia; y se trata de que la ciudadanía pueda ver que se está desarrollando con sus datos. 

Limitaciones también habrá. ¿Podemos oponernos?

–Hay usos prohibidos por la regulación. No se pueden emplear para decisiones perjudiciales, uso de datos de salud para decisiones sobre préstamos, discriminación a grupos determinados en base a los datos, publicidad comercial o productos dañinos. Luego hay derecho de oposición, mecanismos para rechazar el uso secundario de mis datos si no estoy de acuerdo con los fines de este proyecto o en general. Y luego, dentro de la regulación, hay una parte que, si es por interés público, una pandemia, por ejemplo, el derecho de oposición no se tiene en cuenta.  

Es decir, si el sistema público necesita esos datos, aunque no estés de acuerdo en que se use, se podrían expropiar, por decirlo de alguna manera.

–Así es. Por defecto, tus datos están dentro. Tú puedes decir que no quieres que se utilicen para determinada investigación, salvo que sea necesario. Por eso hay que hacer una divulgación clara y accesible que permita a la ciudadanía conocer sus derechos, evaluar implicaciones y participar con confianza. A la sociedad habrá que explicarle que, si hacemos un modelo omitiendo sus datos, ese algoritmo no funcionará tan bien para para ellas, porque no han sido incluidas en los datos entrenamiento, y por tanto, la solución generada funcionará peor para la ciudadanía en su conjunto. Finalmente, hay que decir que los beneficios deben revertir en la sociedad con precios asequibles, acceso equitativo y reinversión en el sistema sanitario público.