Artículo aportado por Chris Holmes, investigador visitante de OGC –
Hace unos seis meses comencé como Primer 'Investigador visitante' del Consorcio Geoespacial Abierto. Ha sido un verdadero placer explorar varios aspectos del OGC más profundamente, trabajando con el personal y los miembros. El tiempo ha volado, así que quería compartir mi progreso y algunas ideas sobre lo que viene a continuación.
El alcance abierto de la beca fue asombroso, pero me di cuenta de que tendría que concentrarme rápidamente si quería tener un impacto real mientras trabajaba medio día a la semana durante seis meses. El tema que surgió lo llamé "OGC nativo de la nube", que explora los componentes fundamentales que permiten los estándares geoespaciales en la nube, a un nivel "por debajo" de las API.
Esta es una evolución de las ideas que presenté hace cuatro años en una serie de blogs llamada 'Geoespacial nativo de la nube', cual abierto Con la pregunta "¿Cómo sería el mundo geoespacial si construyéramos todo desde cero en la nube?". Desde entonces, he dedicado gran parte de mi tiempo a centrarme en dos aspectos fundamentales de esa transformación: GeoTIFF optimizados para la nube y Catálogos de activos espaciotemporalesHemos visto una adopción increíblemente temprana de ambos formatos, pero se ha centrado principalmente en imágenes satelitales multiespectrales, que son solo una pequeña parte del mundo geoespacial en general. Por eso, mi tiempo como investigador visitante de OGC se ha dedicado a debatir sobre esa pregunta original: "¿Qué haría la geoespacial?" Normas ¿Cómo se verían si hubieran sido diseñados para la nube? Pude tomarme el tiempo para observar todo el panorama geoespacial, no solo las imágenes, y el potencial de OGC para desempeñar un papel de liderazgo clave para hacer realidad la visión geoespacial nativa de la nube.
La visión geoespacial nativa de la nube
Al investigar más, descubrí que el trabajo de estándares existente de OGC podría evolucionar fácilmente para alinear la industria con las arquitecturas geoespaciales nativas de la nube. No hay organización mejor posicionada para hacerlo realidad que OGC: todos los gobiernos ya confían en ella como administradora de estándares geoespaciales y cuenta con la comunidad más grande de expertos geoespaciales que trabajan juntos, en organizaciones comerciales, sin fines de lucro, gubernamentales y académicas.
Antes de profundizar en los detalles de los estándares necesarios para respaldar esto, vale la pena una articulación completa del estado futuro que permite esta visión.
La misión de OGC es "lograr que la información de ubicación sea accesible, interoperable, reutilizable y fácil de encontrar". Cloud-Native Geospatial comparte exactamente el mismo objetivo, pero aprovecha la nube para simplificar radicalmente el esfuerzo necesario para lograr que los datos geoespaciales sean FAIR. En lugar de obligar a los proveedores de datos a crear, mantener y escalar sus propias API, el requisito debería ser tan simple como usar el formato y los metadatos geoespaciales nativos de la nube correctos y cargarlos en cualquier nube. Todas las API y la escalabilidad provienen de la propia nube, lo que permite que la tecnología geoespacial se suba a las olas continuas de innovación en el mundo de las TI en general en lugar de intentar "ponerse al día" continuamente.
Un objetivo fundamental de la geoespacialidad nativa de la nube es reducir la carga de los proveedores de datos y, a su vez, permitir que muchos más datos geoespaciales sean FAIR. El único costo que los proveedores deberían tener que pagar es el de la almacenamiento en la nube, que actualmente oscila entre 1 y 5 dólares al mes por 100 gigabytes de datos. Si esos datos básicos están alojados en la nube, las tecnologías nativas de la nube permiten invertir la ecuación de costos, ya que los usuarios de los datos pagan por cualquier cálculo que realicen y, conel solicitante paga' los usuarios incluso pagan por el costos de salida.
Una vez que los datos están en los formatos geoespaciales nativos de la nube adecuados, es fácil para cualquiera configurar un servidor geoespacial tradicional, idealmente uno que haga que los datos estén disponibles como API de OGC. Pero los datos en sí mismos se vuelven FAIR, incluso si no están en una API avanzada, ya que la nube más los estándares clave proporcionan todo lo que se necesita para proporcionar los datos.
Pero las cosas se ponen realmente interesantes cuando pensamos en una nueva clase de herramientas geoespaciales nativas de la nube que pueden superponerse a los datos básicos de FAIR, junto con los servicios geoespaciales tradicionales. Google Earth Engine ha estado operando en este futuro durante años, lo que permite cálculos a escala global que se ejecutan en decenas de miles de nodos de cómputo simultáneamente para brindar respuestas en segundos. Han hecho un trabajo increíble al seleccionar una gran cantidad de datos, pero GEE ha sido tradicionalmente un jardín amurallado donde solo los datos ingresados en GEE podían aprovechar sus capacidades. En la visión geoespacial nativa de la nube, GEE podría usar cualquier dato en la nube (y de hecho han comenzado a adoptar la visión de GNC con Registro del COG).
Más importante aún, cualquier nueva herramienta de computación a escala de la nube como GEE no necesitaría crear su propio catálogo de datos, ya que podría acceder a los mismos formatos geográficos nativos de la nube que utilizan otras herramientas. Tener un conjunto de herramientas geoespaciales nativas de la nube con alojamiento de datos económico abre la posibilidad de una cola más larga En realidad, es justo que las organizaciones más pequeñas que tienen información valiosa pero no los medios para ejecutar servidores adopten la geoespacialidad nativa de la nube, ya que poner sus datos en la nube les permitirá contar con muchas herramientas y análisis increíbles. El acceso a toda la información del mundo en un solo lugar combinado con una computación a escala infinita, a su vez, debería marcar el comienzo de una nueva ola de herramientas innovadoras que vayan más allá del análisis geoespacial tradicional para encontrar patrones más amplios. Luego, la línea entre la información geoespacial y la no geoespacial se difuminará una vez que sea nativa de la nube, lo que magnificará enormemente el impacto potencial de la información geoespacial, pero eso merece una publicación de blog propia.
Alcanzar una masa crítica de datos que sea realmente utilizable por las herramientas avanzadas de la nube abre la posibilidad de una verdadera "búsqueda geoespacial". El paradigma principal hoy en día es que debes conocer o encontrar un servidor geoespacial en particular y luego puedes realizar búsquedas geoespaciales para encontrar la información que necesitas. No existe un "google para información de ubicación" porque no hay un formato estándar para "rastrear", como sí existe el html para la web. Los metadatos y formatos de datos simples que viven en la nube proporcionan la "capacidad de rastreo" básica, en particular cuando tienen un equivalente html que se puede rastrear mediante los motores de búsqueda web tradicionales, como se describe en Mejores prácticas para los datos espaciales en la Web.
El aspecto clave que permite la geoespacialidad nativa de la nube para la búsqueda es el acceso a los datos reales: se pueden transmitir directamente a diversas herramientas que brindan un valor real. Los intentos anteriores de motores de búsqueda geoespaciales mostraban, en el mejor de los casos, una imagen de vista previa y, a menudo, solo una descripción de texto; además, a menudo los datos reales ni siquiera estaban disponibles para su descarga directa: se trataba simplemente de una búsqueda de metadatos. Con la geoespacialidad nativa de la nube, la herramienta de búsqueda puede transmitir datos de resolución completa directamente en el navegador o vincularse a herramientas más potentes que permiten el análisis basado en la nube de los resultados de la búsqueda. La visión geoespacial nativa de la nube se centra primero en obtener una masa crítica de datos en la nube, pero una vez que hay masas de información lo suficientemente valiosas, abre la posibilidad de una nueva clase de tecnologías y empresas enfocadas en herramientas de búsqueda geoespacial más innovadoras.
Hacia una línea base de estándares geoespaciales nativos de la nube
¿Cómo podemos avanzar realmente hacia esta visión? Los estándares básicos están mucho más cerca de lo que se podría esperar, pero hay que destacar que lograr esta visión requerirá mucho más trabajo de toda la industria geoespacial que simplemente publicar algunos estándares. Necesitamos un esfuerzo sostenido para llevar toda la información de ubicación a la nube en formatos estándar, actualizar todas las herramientas para que puedan trabajar con ella y construir juntos una nueva clase de herramientas de próxima generación que demuestren el poder de tener petabytes de información sobre el mundo en un solo lugar.
Esto significa una base muy sólida sobre la que construir, que permita capas y capas de innovación en la parte superior. Pero esta línea base estándar también debe poder adaptarse al panorama tecnológico general, para poder aprovechar las tendencias tecnológicas más amplias (como el cambio de XML a JSON y lo que venga después). La clave para esto es construir pequeñas piezas que estén acopladas de manera flexible, con pocas partes móviles y realmente centrándose en los componentes verdaderamente geoespaciales. Este enfoque es de una simplicidad radical, logrando que las unidades atómicas centrales funcionen correctamente para permitir una innovación inimaginable en la parte superior.
Profundizaré en un plan práctico para llegar a una base de estándares mínima viable para la información geoespacial nativa de la nube, aprovechando todo el excelente trabajo que han realizado la OGC y la comunidad geoespacial en general. Pero mi trabajo en el marco de la beca durante los últimos meses demuestra que estamos potencialmente cerca de la base de referencia, y si trabajamos juntos para lograrlo y desarrollar el ecosistema interoperable de herramientas en torno a él, el poder de la información geoespacial estará disponible para todos. Aquellos de nosotros que trabajamos en el campo conocemos el poder, y si podemos desarrollar una interoperabilidad simple nativa de la nube que facilite a cualquiera el acceso a nuestros datos, entonces el impacto en el mundo será inmensurable.