Lejos de ser una tecnología de “ciencia ficción”, la Inteligencia Artificial (IA) ya desempeña un papel crucial en muchos ámbitos y está revolucionando las tecnologías existentes. Durante la última década, las técnicas de IA como el Aprendizaje Automático (ML) y, especialmente, el Aprendizaje Profundo (DL), han mejorado significativamente debido a la abundancia de datos junto con los avances en la informática de alto rendimiento. Al igual que en tantos otros ámbitos tecnológicos, estas nuevas capacidades de IA han reorientado y transformado los SIG y la Teledetección, proporcionando nuevas soluciones y aumentando enormemente la eficiencia. La aplicación de tecnologías de IA para resolver problemas que experimenta la comunidad geoespacial se conoce como “GeoAI”.
La comunidad científica geoespacial, por ejemplo, suele utilizar la IA y técnicas relacionadas para aprovechar mejor el volumen insuperable de datos de observación de la Tierra que se generan para el análisis geoespacial en diversos ámbitos, como las ciudades inteligentes, la gestión medioambiental y la gestión de desastres. Sin embargo, las posibles aplicaciones de la GeoAI apenas están empezando a aparecer.
“Yo definiría GeoAI como un conjunto de métodos o entidades automatizadas que utilizan datos geoespaciales para percibir, construir (automatizar) y optimizar espacios en los que los humanos –así como todo lo demás– pueden continuar de manera segura y eficiente sus actividades geográficamente referenciadas”, dijo Kyoung-Sook Kim, copresidente del Grupo de Trabajo del Dominio GeoAI de OGC.
“La geointeligencia artificial puede aportar importantes beneficios para impulsar la próxima generación de innovación en servicios en muchas aplicaciones, como el transporte autónomo, la planificación e implementación de ciudades inteligentes sostenibles, la gestión aumentada de edificios y energía, la fabricación autooptimizada, la predicción de brotes epidémicos, la mejora de la experiencia personal y más. Sin embargo, también se enfrenta a una variedad de nuevos desafíos éticos, legales, sociales y tecnológicos. Creo que las normas internacionales desempeñarán un papel fundamental para garantizar la interoperabilidad generalizada y los beneficios de seguridad entre las diversas disciplinas que se ocupan de la IA”.
Las innovaciones en GeoAI impulsadas por estándares abiertos tienen menores costos de desarrollo e implementación, llegan al mercado antes y permiten una integración/composición horizontal y vertical sin inconvenientes de los sistemas GeoAI. Los estándares también aumentarán la seguridad de los enfoques computacionales y las técnicas algorítmicas que impulsan los conocimientos proporcionados por los motores de IA.
Con estos beneficios en mente, en 2018, OGC formó el Grupo de Trabajo de Inteligencia Artificial en el Dominio de la Geoinformática (mejor conocido como GeoAI DWG) para identificar casos de uso y aplicaciones relacionadas con la IA en aplicaciones geoespaciales. El GeoAI DWG ofrece un foro abierto para un amplio debate y presentación de casos de uso para la IA y sus tecnologías relacionadas en el dominio geoespacial, con el propósito de reunir a geocientíficos, científicos informáticos, ingenieros, empresarios y tomadores de decisiones del ámbito académico, la industria y el gobierno para desarrollar, compartir e investigar las últimas tendencias, éxitos, desafíos y oportunidades en el campo.
El GeoAI DWG también tiene la tarea de investigar la viabilidad y la interoperabilidad de los estándares OGC para respaldar el uso y la reutilización de datos geoespaciales en aplicaciones de IA, así como describir las brechas y los problemas que podrían conducir a nuevos estándares geoespaciales.
“Cuando propusimos el OGC GeoAI DWG, encontramos tres problemas principales en la aplicación de tecnologías de IA a los dominios geoespaciales. En primer lugar, hay pocos conjuntos de datos de entrenamiento de referencia a gran escala como ImageNet, que se utiliza para el reconocimiento de objetos en proyectos de visión artificial. Si bien hay una enorme cantidad de imágenes satelitales y datos de nubes de puntos disponibles, la mayoría de ellos no están listos para usarse en tareas de aprendizaje automático geoespacial”, dijo Kyoung-Sook.
“En segundo lugar, en comparación con los campos relacionados del procesamiento de imágenes y el procesamiento del lenguaje natural, pocas herramientas abiertas y flujos de trabajo que utilicen GeoAI se comparten en los SIG y otras operaciones comerciales”, dijo Kyoung-Sook. “Las organizaciones aún pagan el costo total de desarrollo e implementación cuando adaptan una nueva técnica de GeoAI a un caso comercial, en lugar de aprovechar las herramientas y soluciones abiertas establecidas.
“La tercera cuestión, que creo que es la más importante, es apoyar una tecnología GeoAI confiable y segura para apoyar el bienestar de la Tierra y de la humanidad. El informe de 2018 del Foro Económico Mundial (Serie La cuarta revolución industrial para la Tierra: Aprovechar la inteligencia artificial para la Tierra) afirma que la consideración más importante en el desarrollo de la IA, independientemente de su etapa, es garantizar beneficios sostenibles para la humanidad, que incluyan ser tanto "amigable con los humanos" como "amigable con la Tierra".
“Volviendo al primer tema, me gustaría que el GeoAI DWG solucionara primero la falta de conjuntos de datos de entrenamiento y mejorara el intercambio de conocimientos entre personas capacitadas. Esta falta de intercambio de datos y conocimientos provoca un mal uso de la IA y crea modelos de IA sesgados. Para abordar esto, los miembros del DWG han comenzado a recopilar y analizar aplicaciones y casos de uso relacionados con la IA en nuestras comunidades.
“Recientemente, OGC también ha iniciado la formación del nuevo Grupo de trabajo de estándares de lenguaje de marcado de muestra para aprendizaje automático de inteligencia artificial (SampleML-AI/ML SWG) para desarrollar un estándar para documentar, almacenar y compartir los datos de muestra geoespaciales”.
Un componente clave de las técnicas y procesos de ML es el uso de datos de muestra (datos con procedencia conocida, metadatos consistentes y mediciones de calidad) para ajustar y entrenar de manera consistente las aplicaciones de ML. La falta de datos de muestra consistentes y conocidos está obstaculizando las aplicaciones avanzadas de la ciencia de la EO, causando problemas de reproducibilidad y dificultando la comparación de resultados entre estudios.
Los datos de muestra deben tener suficientes metadatos en un formato estándar legible por máquina e incluir información espaciotemporal general y atributos específicos de los datos de muestra para facilitar el descubrimiento y la consulta de datos. Debido a su utilidad en aplicaciones de aprendizaje automático geoespacial, muchas áreas académicas e industriales se han centrado en la creación de sus propios conjuntos de datos de referencia.
Sin embargo, para poder acceder y compartir estos conjuntos de datos de entrenamiento de manera fácil y eficaz, se requiere un estándar internacional para los esquemas y formatos de datos. Una solución propuesta por OGC es desarrollar un lenguaje de marcado de muestra estandarizado para IA/ML (basado en estándares de la industria comúnmente utilizados siempre que sea posible) que permita a los usuarios documentar, almacenar y compartir datos de muestra geoespaciales a través de la web siguiendo los principios de gestión de datos FAIR de facilidad de búsqueda, accesibilidad, interoperabilidad y reutilización.
La formación del grupo de trabajo de estándares SampleML-AI/ML, respaldado por el GeoAI DWG, está casi completa. El grupo de trabajo se encargará de desarrollar un estándar SampleML-AI/ML de OGC, con categorías iniciales de datos de muestra geoespaciales para imágenes de teledetección, características en movimiento (normalmente trayectorias de vehículos) y contenido espacial relacionado.
Además de esto, el Testbed 18 de OGC tiene una tarea dedicada a los conjuntos de datos de entrenamiento de aprendizaje automático. Para citar la convocatoria de participación del Testbed 18: “El objetivo de esta tarea Testbed-18 es desarrollar las bases para la estandarización futura de TDS para aplicaciones de observación de la Tierra. La tarea evaluará el status quo de los formatos de datos de entrenamiento, los modelos de metadatos y las cuestiones generales de uso compartido y reutilización. Varias iniciativas, como AI-Ready EO Training Datasets (AIREO) de la ESA, han desarrollado sugerencias que podrían usarse para la estandarización futura. Otras iniciativas se centraron en el desarrollo de repositorios de datos de entrenamiento, como Radiant MLHub, un repositorio de datos de entrenamiento geoespacial de acceso abierto donde cualquiera puede descubrir y descargar conjuntos de datos de entrenamiento listos para ML”. Para obtener más información sobre esta tarea, consulte Sección 2.2. Conjuntos de datos de entrenamiento de aprendizaje automático en el banco de pruebas 18 Convocatoria para participar.
GeoAI ya está haciendo cosas increíbles para la industria de la localización. Sin embargo, para alcanzar realmente su potencial, necesitamos construir una base sólida de estándares abiertos para compartir datos de muestra y crear herramientas y flujos de trabajo abiertos, así como mejores prácticas abiertas para garantizar el uso seguro y ético de esta poderosa tecnología.
Si está interesado en contribuir a la creación de estándares, mejores prácticas y/o documentación de casos de uso para aplicaciones de GeoAI, considere unirse al Grupo de trabajo de inteligencia artificial en el dominio de la geoinformática. Los miembros de OGC pueden unirse a través del Portal OGC aquíLos no miembros pueden unirse contactándose con OGC mediante el formulario en ogc.org/contact.
También se anima a los interesados a asistir al próximo Reunión de miembros de la OGC, donde probablemente se reunirá el OGC GeoAI DWG (por confirmar), junto con muchos otros estándares OGC relacionados y grupos de trabajo de dominio.
Una versión de este artículo apareció originalmente en la edición de otoño de 2021 de Revista internacional GeoConnection.