Artículo de blog

Navegando la era de las imágenes sintéticas: Por qué es importante confiar en los datos geoespaciales

Descubra cómo el marco de Integridad, Procedencia y Confianza (IPT) de OGC garantiza la confiabilidad, transparencia y precisión de los datos en todas las industrias.

En una era donde las imágenes sintéticas, los deepfakes y los flujos de trabajo de IA cada vez más complejos dominan nuestro panorama digital, la confianza en los datos nunca ha sido tan crucial. ¿Cómo podemos confiar en los datos que sustentan nuestras decisiones más importantes, desde la gestión de inundaciones e incendios forestales hasta la seguridad nacional, la respuesta a emergencias y la planificación de infraestructuras?

Consideremos las catastróficas inundaciones en Alemania en 2021. A pesar de los sistemas de alerta avanzados, surgieron dudas sobre la precisión y la puntualidad de los datos de los modelos de predicción de inundaciones, lo que contribuyó a retrasos en las evacuaciones y a la pérdida de más de 180 vidas. En Australia, durante los incendios forestales de 2020, las lagunas e imprecisiones en las imágenes satelitales dificultaron la planificación y el despliegue eficaz de recursos por parte de los servicios de emergencia.

Hay mucho en juego en materia de seguridad nacional e información pública. En 2022, un video deepfake de un destacado líder político se viralizó, socavando brevemente la confianza pública y generando preguntas urgentes sobre su autenticidad y atribución. Durante la pandemia de COVID-19, la desinformación y la presentación inconsistente de datos generaron confusión y complicaron los esfuerzos para coordinar una respuesta eficaz de salud pública. Estos no son escenarios extremos; son un anticipo de lo que ocurre cuando la integridad, la procedencia y la confianza de los datos no están integradas en nuestros sistemas por diseño.

Es por eso que el Consorcio Geoespacial Abierto (OGC) está desarrollando un marco integral para Integridad, procedencia y confianza (IPT) En datos geoespaciales. Este trabajo busca crear una base en la que organizaciones de todo el mundo puedan confiar y desarrollar para garantizar que sus datos no solo sean útiles, sino también confiables.

Este es el comienzo de una iniciativa de un año de duración para definir cómo son realmente los datos geoespaciales confiables y cómo nosotros, como comunidad global, podemos garantizar que respalden los sistemas de los que todos dependemos.

Por qué es importante ahora

Las organizaciones actuales dependen de un ecosistema de datos cada vez más vasto e interconectado, que a menudo incorpora datos de proveedores externos o los procesa mediante modelos de IA de caja negra. Pero esta comodidad tiene un precio: ¿podemos estar seguros de que los datos son lo que dicen ser?

Ya hemos visto imágenes satelitales fabricadas, modelos urbanos 3D generados por IA y redes viales sintéticas. Estos no son solo riesgos teóricos, sino desafíos reales para la confianza pública, la precisión operativa y la rendición de cuentas.

En entornos de alto riesgo, la incertidumbre sobre la integridad o el origen de los datos puede provocar análisis erróneos, advertencias inadvertidas o incluso fallos en las políticas. Es hora de pasar de la confianza ciega a la confianza basada en la evidencia.

Comencemos con algunas definiciones y un ejemplo para establecer la perspectiva de OGC en la construcción de este marco.

Integridad Se refiere a cómo se han gestionado los datos a lo largo de su ciclo de vida, incluyendo características como el contenido, la precisión y la integridad, desde su recopilación hasta su procesamiento y distribución. La integridad puede verse comprometida por manipulaciones, errores o cambios no documentados, por lo que las salvaguardas son esenciales para garantizar la fiabilidad.

Procedencia Se refiere al origen de los datos, cómo se han modificado y quién o qué realizó dichas modificaciones. La procedencia se ve comprometida cuando las operaciones que alteran los datos no se registran, lo que afecta tanto la trazabilidad como la integridad.

Cuando la integridad y la procedencia están bien documentadas, son consistentes e inalterables, existe una base para Confianza En los datos. La confianza no solo implica que el usuario esté seguro de que los datos cumplen con sus expectativas, sino también que su origen, evolución e idoneidad pueden describirse con claridad para que otros también puedan utilizarlos.

Por ejemplo, un satélite con parámetros de cámara conocidos captura una imagen. Esta se envía directamente a una organización que la ajusta para que se ajuste a un modelo de terreno mediante un algoritmo bien definido. La imagen ajustada se utiliza para calcular el tamaño de un lago, sabiendo que la fuente tiene una resolución de píxeles determinada y que el procesamiento incluyó la manipulación de los datos para conservar dicha resolución original. Si cada una de estas transacciones —desde la recolección hasta el procesamiento y la entrega— se documenta con parámetros estandarizados e inequívocos, los usuarios pueden confiar en que los datos se ajustan a sus necesidades y en que los análisis pueden validarse y reproducirse.

CREANDO CONFIANZA EN LOS DATOS GEOESPACIALES: AVANCES Y PRÓXIMOS PASOS

OGC y otros han logrado avances significativos en el desarrollo EstándaresHerramientas y marcos que mejoran la IPT en datos geoespaciales. Estos esfuerzos sientan las bases para garantizar la fiabilidad, trazabilidad y usabilidad de los datos en diferentes sectores. Algunos aspectos del marco de la IPT ya están implementados o se implementarán próximamente, como los siguientes.

Integridad

Los estándares de metadatos definen los datos originales y transformados. Existen estándares consolidados para el registro de metadatos, pero es necesario desarrollar directrices sobre el uso eficaz de la terminología común para permitir comparaciones equitativas.

Modelo de sensor de OGC El registro garantiza descripciones consistentes de las capacidades de los sensores. Este registro resuelve parte del problema, pero es necesario desarrollar o integrar conjuntos de definiciones similares para describir otras fuentes y métodos de captura de datos.

Procedencia

Lenguaje de marcado de datos de entrenamiento de OGC para IA Estandariza los conjuntos de datos de entrenamiento y validación. Se propone un nuevo trabajo en OGC para desarrollar metadatos especializados que describan los modelos de IA utilizados en el procesamiento de datos geoespaciales.

El registro de medidas de calidad de datos de OGC e ISO establece descripciones cuantificables y consistentes de la calidad de los datos. Estas medidas de calidad se aplican para describir la integridad de los datos y el impacto del procesamiento que determina la procedencia de la información.

OGC está implementando bloques de construcción de procedencia en múltiples proyectos de la Unión Europea. Estándares API de OGC Se construyen a partir de una serie de bloques funcionales implementables independientemente que, en conjunto, pueden ensamblarse para crear una implementación. De igual manera, los descriptores de operaciones que impactan la integridad y que forman parte de la procedencia de los datos pueden ser modulares e insertarse en cada paso del ciclo de vida de los datos.

Que viene despues

A pesar de estos avances, aún no se ha completado un modelo de confianza integral, creado a partir de componentes IPT interoperables y basados ​​en estándares.

Durante el próximo año, OGC trabajará con miembros y socios para:

  • Integrar los bloques de construcción de IPT en los sistemas operativos y flujos de trabajo
  • Asegúrese de que los descriptores sean legibles por máquina, a prueba de manipulaciones y procesables.
  • Paquete de parámetros IPT con conjuntos de datos para una transparencia de extremo a extremo
  • Reflejar las necesidades de los usuarios del mundo real a través de la colaboración abierta y pruebas compartidas

Sea parte del futuro de los datos confiables

Este blog inicia un análisis más profundo del marco de integridad, procedencia y confianza y cómo nosotros, como comunidad, podemos construir algo significativo y escalable juntos.

Publicaremos artículos técnicos destacados, casos prácticos reales y oportunidades de participación a lo largo del año. Ya seas desarrollador de estándares, usuario de datos, experto en IA o funcionario público, tu perspectiva es esencial.

Unete al movimiento:

Hagamos que la confianza en los datos sea visible, medible y compartida, para que todos puedan tomar mejores decisiones con confianza.