Espacios de datos: lo que se esconde tras este nombre
En los últimos años, múltiples tecnologías han irrumpido en el ecosistema tecnológico mundial. Una de las más ambiciosas se encuentra detrás de un sencillo nombre: espacios de datos. Una denominación que, a primera vista, parece referirnos a algún tipo de almacenamiento en la nube donde compartir archivos de manera segura. Una suerte de nube europea con más gobernanza. Cuando buscamos su definición, nos encontramos con una colección de adjetivos bien intencionados: entornos federados fiables para compartir información y extraer valor del dato, que proporcionan soberanía, seguridad y gobernanza. No es exactamente la clase de definición que despierta curiosidad a primera lectura. Y, sin embargo, tras esa denominación discreta y esa acumulación de conceptos, se esconde una de las iniciativas más relevantes para la competitividad digital europea. El objetivo de estas líneas es tratar de explicar la idea que se esconde tras esta denominación aparentemente modesta, y por qué debería importarnos con independencia de nuestro rol en el ecosistema digital. ■ Los espacios de datos representan una de las apuestas más ambiciosas de Europa para construir una economía digital basada en la soberanía, la interoperabilidad y la confianza. Espacios de datos: una visión práctica de la soberanía digital europea Empecemos por el final. Estamos en marzo de 2029. Una mujer de Gijón está de viaje en Viena. Una tarde sufre una urgencia cardíaca. La ambulancia la lleva al hospital general de la ciudad. El médico austríaco necesita su historial. Hoy, eso significaría llamadas a España, faxes, correos electrónicos a un hospital que probablemente no contestaría a tiempo. En el mejor de los casos, un PDF con un resumen incompleto que nadie podría verificar. En 2029, la paciente desbloquea su móvil y autoriza el acceso con un gesto. Su Cartera de Identidad Digital Europea —que todos los Estados miembros deberán ofrecer a sus ciudadanos antes de que termine 2026— verifica quién es, otorga un consentimiento específico, trazable y revocable, y abre la puerta. El hospital de Viena y el de Gijón no se conocen. No tienen un convenio bilateral. No lo necesitan. La red MyHealth@EU ya ha establecido un marco de reglas comunes e interoperabilidad. Formato estandarizado. Autenticación europea. Condiciones legales predefinidas por un Reglamento comunitario. Todo el trabajo de negociación está previamente realizado. En segundos, el médico tiene en pantalla medicaciones, alergias y condiciones crónicas. El dato no ha viajado. El acceso, sí. * * * Mientras tanto, a pocos kilómetros, un equipo de investigación oncológica necesita validar un biomarcador predictivo para cáncer de páncreas. Hace cinco años, un estudio así habría requerido negociar la cesión de datos con cada hospital uno a uno, pasar por comités éticos en cada país, y armarse de una paciencia que se mide en años. Ahora solicitan acceso a través del Health Data Access Body, el órgano que el propio Reglamento ha creado para esto. Las condiciones de uso están escritas en un lenguaje que las máquinas entienden —un estándar W3C llamado ODRL— y el conector del espacio de datos las lee, las interpreta y, si la solicitud cumple los requisitos, facilita el acceso. El proceso que hoy lleva años —negociación bilateral, comités éticos en cada país, cesión caso por caso— se canaliza a través de un punto único con reglas predefinidas. Los plazos se reducen de años a semanas. Mediante técnicas como el aprendizaje federado (federated learning), un modelo de inteligencia artificial viaja a cada hospital, aprende de los datos locales sin que estos se muevan, y solo los pesos del modelo regresan. En un plazo que antes se medía en años, obtienen resultados con millones de historias clínicas. Sin que los datos clínicos originales hayan abandonado cada hospital. Los espacios de datos permiten extraer valor colectivo de la información sin necesidad de centralizarla. * * * En otra esquina del continente, un consorcio de empresas europeas de logística quiere entrenar un modelo de inteligencia artificial que optimice rutas de transporte multimodal (camión, tren, barco) combinando datos de tráfico, climatología, consumo energético y demanda en tiempo real. Cada empresa tiene datos valiosos, pero ninguna los suficientes por sí sola, y todas comparten la misma reticencia: perder capacidad de control sobre esos datos en el proceso de entrenamiento del modelo. El espacio de datos de movilidad les ofrece una alternativa: cada organización publica sus activos de datos bajo condiciones que ella misma define, el modelo se entrena de forma distribuida, y el resultado es un modelo entrenado con datos bajo control europeo, sin que ningún intermediario haya tenido acceso al conjunto. ■ En la carrera global por la Inteligencia Artificial, los datos son el recurso escaso. Los espacios de datos permiten que Europa compita en IA sin tener que centralizar sus activos de información en manos ajenas. En una fábrica de Múnich, un ingeniero necesita verificar la huella de carbono de un componente fabricado en la República Checa. No envía un email. No espera un informe. Su sistema consulta el catálogo del proveedor, negocia automáticamente las condiciones de acceso y obtiene la información en tiempo real. El pasaporte digital de producto permite trazar la cadena de producción y certificar la huella ambiental de cada componente. En Asturias, una cooperativa quesera quiere vender a una cadena de supermercados alemana que exige certificar la trazabilidad y la huella ambiental del producto. Si el espacio de datos agroalimentario europeo avanza según lo previsto, la cooperativa podrá conectar su sistema y hacer verificables en tiempo real los datos de origen, pasteurización y cadena de frío. Lo que hoy requiere múltiples procesos de validación y auditorías se resuelve con una conexión digital. Lo diferencial de estos escenarios no es la capacidad técnica de intercambiar información. Eso hace tiempo que existe. Lo diferencial es el marco de confianza que permite hacerlo a escala: contratos legibles por máquinas que eliminan meses de negociación, una identidad digital europea que permite autenticarse sin conocerse previamente, protocolos comunes que aseguran interoperabilidad, y un respaldo regulatorio que da seguridad jurídica a todos los participantes. Estos marcos no solo son carreteras para compartir datos, sino también el código de circulación que permite que millones de vehículos diferentes circulen por ellas sin chocar. Aunque lo descrito es un escenario prospectivo, nada de esto es ciencia ficción. La regulación está aprobada. Los conectores funcionan. Los pilotos existen. ■ El horizonte de 2029 no es una hipótesis futurista: se basa en regulaciones europeas ya aprobadas, pilotos operativos y tecnologías que están disponibles hoy. Pero para entender cómo hemos llegado aquí, hay que retroceder quince años. El origen de los espacios de datos: de Fraunhofer a la Estrategia Europea de Datos En 2014, un grupo de investigadores de la Sociedad Fraunhofer en Alemania se hizo una pregunta: ¿es posible compartir datos entre organizaciones sin perder el control sobre ellos? La pregunta no era académica. Europa llevaba años observando cómo las grandes plataformas tecnológicas —principalmente estadounidenses y chinas— construían imperios basados en un modelo simple: centralizar los datos de millones de personas y empresas, extraer valor de ellos y devolver servicios. Las organizaciones y los ciudadanos generan gran parte del dato, mientras que las plataformas tienen la capacidad de extraer valor del dato agregado y procesado. Un modelo extraordinariamente eficaz desde el punto de vista empresarial, pero que planteaba una asimetría difícil de aceptar: quien controla los datos, controla el juego. Durante años compartir datos significó generar valor para terceros mientras se perdía capacidad de control sobre ellos. Alemania, con su potente tejido industrial, lo sentía con especial intensidad. Sus fabricantes de automóviles, sus proveedores de componentes, sus empresas del Mittelstand, necesitaban compartir información a lo largo de cadenas de suministro cada vez más complejas. Pero hacerlo significaba, en la práctica, entregar datos a plataformas que no controlaban. Compartir era, paradójicamente, perder. De esa tensión nació el concepto que hoy conocemos como soberanía del dato: el principio de que quien genera un dato mantiene el control sobre quién puede acceder a él, bajo qué condiciones y con qué propósito. Incluso después de compartirlo. Es la diferencia entre prestar un libro y fotocopiarlo. En el primer caso, decides a quién, cuándo y cómo. En el segundo, pierdes el control para siempre. ■ La soberanía del dato parte de una idea sencilla: compartir información no debería implicar renunciar al control sobre ella. Aquel proyecto se llamó Industrial Data Space. Un año después se renombró como International Data Spaces, porque la ambición desbordó las fronteras industriales y alemanas. En 2016 se fundó la International Data Spaces Association (IDSA), guardiana de un estándar —el IDS Reference Architecture Model— que detalla cómo los participantes se identifican, negocian contratos de uso e intercambian información de forma segura y trazable. Y el salto verdaderamente transformador llegó el 19 de febrero de 2020, cuando la Comisión Europea publicó la Estrategia Europea de Datos y convirtió un concepto nacido en un laboratorio en política continental, proponiendo la creación de espacios comunes europeos de datos en más de catorce sectores estratégicos: salud, agricultura, movilidad, energía, manufactura, finanzas, administración pública, turismo, lenguas, patrimonio cultural y más. Lo que comenzó como una pregunta de investigación en Alemania acabó convirtiéndose en una estrategia para toda Europa. El tercer camino: el modelo europeo de datos Para entender los espacios de datos, hay que entender el tablero sobre el que juegan. Hoy existen tres grandes modelos de gobernanza del dato en el mundo: El modelo estadounidense ha tendido a apoyarse en la iniciativa de mercado y el liderazgo de grandes plataformas tecnológicas, que recopilan, almacenan y explotan datos con una regulación más flexible. La innovación va primero. El resultado es un ecosistema extraordinariamente dinámico, a menudo concentrado en pocas manos. El modelo chino, en contraste, se caracteriza por una supervisión estatal más intensa sobre los flujos de datos. El gobierno impone reglas estrictas de localización y utiliza la información de forma estructurada como herramienta de gobernanza y competitividad estratégica. Europa, tradicionalmente alejada de ambos modelos, apostó por un tercer camino: un ecosistema donde los datos fluyan de forma segura y regulada entre organizaciones, sin centralización en plataformas dominantes y sin control estatal del dato. Un modelo basado en derechos, privacidad, competencia justa y, sobre todo, soberanía. Los espacios de datos no intentan sustituir una plataforma por otra. Intentan hacer posible un ecosistema donde ninguna plataforma sea imprescindible. Los espacios de datos son la materialización técnica de esa filosofía. Mientras otros modelos se construyeron sobre plataformas (el que tiene la mejor plataforma, gana), Europa decidió construir sobre protocolos y reglas compartidas. Es la diferencia entre una lengua franca impuesta desde una posición dominante y una que emerge por consenso. Más lenta de adoptar, pero potencialmente más justa y duradera. ■ Los espacios de datos son la traducción tecnológica de una decisión política: permitir que los datos generen valor sin que ese valor dependa de una plataforma dominante. ¿Qué es realmente un espacio de datos y cómo funciona? Un espacio de datos no es un almacén centralizado donde todos suben sus archivos. No es un almacenamiento europeo en la nube, ni un data lake compartido, ni una simple colección de API públicas. Un espacio de datos es algo más parecido a un sistema circulatorio. La sangre (la información) fluye por venas y arterias (los protocolos y conectores) entre órganos (las organizaciones, públicas y privadas), cada uno con su función, pero todos conectados y bajo un conjunto de reglas compartidas que garantizan que el sistema funcione. Un espacio de datos no es un lugar donde almacenar información. Es un mecanismo para compartirla manteniendo el control sobre ella. Cada órgano mantiene su autonomía. El corazón no le dice al hígado qué hacer, pero ambos comparten recursos vitales a través de un sistema común. Los datos nunca 'salen' de su origen: permanecen en la infraestructura de cada organización. Lo que viaja es el acceso controlado — bajo contratos digitales que especifican quién puede acceder, a qué, durante cuánto tiempo y con qué propósito. ■ Una de las ideas más importantes de los espacios de datos es que los datos permanecen donde están. Lo que se comparte es el acceso, siempre bajo condiciones definidas por quien los genera o custodia. La pieza clave que hace posible todo esto es el conector: un componente software que actúa como la puerta de entrada de una organización al espacio de datos. El conector se encarga de autenticar participantes, negociar contratos de uso, transferir información de forma segura y, crucialmente, aplicar las políticas que el propietario del dato ha establecido. Existen varias implementaciones de referencia, como los Eclipse Dataspace Components o el FIWARE Data Space Connector, todas basadas en código abierto y en un protocolo común — el Dataspace Protocol — que permite que diferentes implementaciones puedan comunicarse entre sí. Los conectores son el equivalente a las puertas de entrada y salida de una organización dentro de un espacio de datos. Además, la Comisión Europea está desarrollando SIMPL (Smart Middleware Platform), una distribución de software abierto —como Ubuntu es para Linux— que proporciona los componentes necesarios para que cualquier organización pueda desplegar y operar un espacio de datos. Todo esto, sostenido por una arquitectura regulatoria muy ambiciosa. El Data Governance Act establece las reglas de gobernanza y confianza; el Data Act clarifica los derechos de acceso y uso, especialmente para datos generados por dispositivos conectados. Y por encima, el GDPR, la ley de IA y el resto del entramado regulatorio europeo que, nos guste más o menos, constituye uno de los marcos de protección digital más ambiciosos del mundo. ■ Los espacios de datos no son solo una arquitectura tecnológica. Son también una arquitectura regulatoria que combina interoperabilidad, gobernanza y seguridad jurídica. La tecnología permite compartir datos. La regulación permite hacerlo con confianza. Mucho más que archivos compartidos: servicios, IA y datos en tiempo real Un punto importante a aclarar. Cuando hablamos de 'datos' o incluso 'datasets' (conjuntos de datos), la mayoría imagina archivos: tablas de Excel, CSVs, datasets que se descargan y se procesan por lotes. Y sí, un espacio de datos puede hacer eso. Pero reducirlo a eso es como describir Internet como 'un sistema para enviar correos electrónicos'. Técnicamente correcto, radicalmente incompleto. Describir un espacio de datos como un repositorio de archivos es tan limitado como describir Internet como una red para enviar emails. Los conectores de un espacio de datos soportan múltiples paradigmas de intercambio. Una organización puede exponer un servicio REST en tiempo real que otras consultan bajo demanda — no se descarga un archivo, se hace una pregunta y se obtiene una respuesta. Puede ofrecer suscripciones y notificaciones: en lugar de preguntar repetidamente '¿hay novedades?', un participante se suscribe a un evento y recibe alertas automáticas cuando se cumple una condición. Y en escenarios avanzados, como vimos con la investigación oncológica, puede enviar modelos de inteligencia artificial que viajan al dato — los datos nunca se mueven, es el algoritmo el que se desplaza. Es decir, podemos hablar de activos de datos de todo tipo: Datos estáticos. Datos en tiempo real. APIs. Modelos de machine learning. Servicios de inferencia. Servicios de consulta. Servicios de notificación. ... ■ Un espacio de datos no intercambia únicamente ficheros. Puede intercambiar servicios, eventos, modelos de IA, APIs y cualquier otro activo digital susceptible de generar valor. La arquitectura refleja esta versatilidad. Los conectores separan un plano de control (donde se negocian permisos, contratos y políticas) de un plano de datos (donde viaja la información real, sea un archivo, una respuesta API o los pesos de un modelo). El plano de control es el mismo siempre; el plano de datos se adapta a lo que necesites intercambiar. El plano de control define las reglas del juego. El plano de datos ejecuta el intercambio. Lo que se comparte en un espacio de datos no son datos en el sentido plano de la palabra. Son servicios de información: capacidades que otros pueden invocar, consultar o consumir, siempre bajo las condiciones que el propietario ha establecido. ■ El verdadero valor de los espacios de datos está en permitir que organizaciones distintas colaboren utilizando datos, servicios y algoritmos sin perder el control sobre ellos. Desafíos de los espacios de datos: interoperabilidad, regulación y modelos de negocio Sería ingenuo no reconocer que hay obstáculos significativos. Y conviene ser honesto sobre su magnitud. Para la construcción de los espacios de datos, las organizaciones tienen que acordar reglas, contratos, políticas, semántica estandarizada… un esfuerzo de coordinación necesario para construir un sistema interoperable que forme una cadena de valor. La complejidad regulatoria es alta. Construir cadenas de valor conformes al GDPR, el Data Governance Act, el Data Act, la ley de IA y la regulación sectorial específica requiere un esfuerzo jurídico y técnico. Los modelos de negocio son inciertos. La mayoría de proyectos actuales dependen de financiación pública europea. Para que los espacios de datos sobrevivan más allá de los programas de subvención, el valor de participar tiene que ser tangible y medible para cada organización individual — no solo para el ecosistema en abstracto. La fragmentación técnica. La interoperabilidad que se predica en los documentos de arquitectura debe materializarse en la práctica. La visión está clara. El reto ahora consiste en convertir la interoperabilidad prometida en interoperabilidad real. Y mientras Europa diseña y certifica, las grandes plataformas en la nube ofrecen soluciones de intercambio de datos que funcionan hoy. Son propietarias, sí. Centralizadoras, sí. Pero funcionan. Los espacios de datos compiten desde la posición del código abierto, la transparencia y la ausencia de lock-in — ventajas estratégicas a largo plazo que no siempre ganan la batalla del corto plazo. ■ Los espacios de datos compiten con soluciones que ya están desplegadas y generan valor hoy. Su apuesta diferencial se basa en la soberanía, la transparencia y la ausencia de dependencias tecnológicas. Probablemente, uno de los mayores obstáculos es que las propias empresas no terminen de identificar el verdadero objetivo de los espacios de datos. Que los vean como otro proyecto europeo de compliance, como una obligación regulatoria más en lugar de como una oportunidad estratégica. Que se queden en la superficie del nombre y nunca lleguen a comprender la profundidad de lo que permiten. Si este artículo sirve para algo, espero que sea para desarmar ese malentendido. El mayor riesgo no es tecnológico. Es que las organizaciones interpreten los espacios de datos como una obligación regulatoria en lugar de una oportunidad estratégica. Estos desafíos son propios de cualquier infraestructura transformadora en sus primeras fases. El sistema de pagos europeo SEPA necesitó más de una década de trabajo — desde la creación del European Payments Council en 2002 hasta la migración obligatoria en 2014 — y hoy nadie cuestiona su valor. Lo fundamental es que el diseño es sólido, la regulación avanza, y los primeros casos de uso reales empiezan a demostrar que la visión es viable. Pero la diferencia entre una visión que se cumple y una que se queda en papel es la velocidad de ejecución. Y ahí es donde todos los que trabajamos en esto tenemos una responsabilidad. La diferencia entre una visión que transforma un continente y una que acaba olvidada en un informe es la velocidad con la que se ejecuta. Epílogo: espacios de datos como infraestructura de soberanía digital europea Los espacios de datos son la infraestructura sobre la que Europa está construyendo su soberanía digital. Son el sistema circulatorio de una economía que aspira a ser inteligente sin dejar de ser justa. Son la apuesta de que es posible compartir sin perder, colaborar sin ceder el control, e innovar sin centralizar. Y son el reflejo de una forma de entender la tecnología, más abierta, federada, colaborativa, justa y soberana. Compartir sin perder. Colaborar sin ceder el control. Innovar sin centralizar. Esa es la promesa que hay detrás de los espacios de datos. Desde Telefónica llevamos años contribuyendo a construir estos espacios —en sanidad, administración pública, medios de comunicación, industria de la lengua– entendiéndolos como una infraestructura compartida que se construye entre todos. Porque ninguna empresa sola puede construir un espacio de datos, igual que ninguna empresa sola construyó la red que hoy permite que leas este artículo. ■ Los espacios de datos son, por definición, una construcción colectiva. Su valor no depende de una organización concreta, sino de la capacidad de todo el ecosistema para colaborar bajo reglas comunes. El resultado no está escrito. Depende de que reguladores, tecnólogos, empresas y ciudadanos entendamos que lo que está en juego no es una tecnología más, sino la arquitectura de cómo vamos a convivir con los datos en las próximas décadas. Y eso, por mucho que el nombre no lo sugiera, es probablemente la decisión tecnológica más importante que Europa va a tomar en esta década. Lo que está en juego no es una tecnología concreta, sino las reglas bajo las que compartiremos, utilizaremos y gobernaremos los datos durante las próximas décadas. AI & Data Descifrando los Espacios de Datos (parte I): Una guía para empresas 9 de septiembre de 2024
8 de junio de 2026