Artículo de blog

Lo último sobre estándares geoespaciales nativos de la nube en OGC

Scott Simmons, director de estándares de OGC, analiza los elementos del ecosistema de la nube que OGC está abordando: interfaces, aplicaciones, codificaciones y operaciones.

Lo último sobre la nube nativa en OGC

Pensé que sería valioso compartir una actualización de las actividades geoespaciales nativas de la nube en OGC, especialmente a la luz de nuestro reciente y exitoso evento de divulgación sobre nativos de la nube. Este blog es un seguimiento de las actividades visión compartido por la directora ejecutiva de OGC, la Dra. Nadine Alameh, en abril de 2022 y dos publicaciones del investigador visitante de OGC, Chris Holmes: Hacia un OGC nativo de la nube y Hacia una línea base de estándares geoespaciales nativos de la nube.

Durante muchos años, OGC ha estado trabajando en numerosos aspectos de todo el ecosistema de datos de ubicación en entornos de nube. A partir de Testbed 10 en 2013, OGC ha estado publicando guías de ingeniería sobre temas de la nube, como Banco de pruebas 10 Rendimiento de los servicios OGC en la nube: los casos WMS, WMTS y WPSDesde esos primeros esfuerzos, los miembros de OGC han reconocido que nuestro enfoque para habilitar capacidades geoespaciales nativas de la nube debe incluir todo este ecosistema: formatos, servicios, arquitecturas y operaciones. Resumí esta perspectiva en el evento de divulgación en el que se habló sobre Avances en las actividades geoespaciales nativas de la nube OGC y lo explicaré con más detalle en esta entrada del blog.

El ecosistema de la nube es más que la plataforma en la que se almacenan y se utilizan los datos, sino que también incluye los algoritmos para procesar la información; las interfaces entre humanos y máquinas; los formatos para almacenar y recuperar información; el régimen de seguridad para el contenido y el acceso; las operaciones comerciales y los modelos de ingresos para sustentar los entornos; la supervisión regulatoria que puede afectar lo que entra o sale de la nube; y mucho, mucho más. “Ecosistema” es realmente el término correcto, ya que se puede imaginar una analogía casi 1 a 1 entre la nube y un ecosistema natural.

Construyendo un ecosistema

El resto de este blog profundiza en los elementos del ecosistema que OGC aborda: interfaces, aplicaciones, codificaciones y operaciones.

Para empezar, no podemos hablar de geoespacial en la nube sin hablar también de la web: es a través de los recursos web que muchos usuarios interactúan con datos y funciones alojados en la nube. OGC y la Consorcio World Wide Web (W3C) colaboró ​​en 2017 para publicar el Mejores prácticas para los datos espaciales en la Web como un medio para ilustrar cómo hacer que la información geoespacial sea más nativa de la web. La nativa de la web hace que la nativa de la nube sea más accesible. No es suficiente almacenar datos en la nube en formatos que mejoren el acceso y el rendimiento del análisis: también necesitamos desarrollar API para descubrir, procesar y extraer información de la nube y guiar a los usuarios para que puedan trabajar en instancias de nube alojadas por múltiples proveedores. El impacto de la modernización de estándares centrados en la web en OGC en la habilitación del ecosistema de la nube no se puede subestimar.

Estas API incluyen OGC API – Features, fundamental para acceder a datos de características (vectoriales), así como para sustentar la Especificación de la API de STAC, utilizado para el descubrimiento rápido de teledetección y otros datos. Ampliando el paradigma del catálogo, API de OGC: registros Permite el descubrimiento y acceso a todo tipo de datos geoespaciales con un nivel de detalle que llega hasta el nivel de registro. La arquitectura de estas API permite a los desarrolladores implementar “solo la información geoespacial necesaria” para obtener los datos que necesitan sin convertirse en expertos geoespaciales.

Muchas personas identifican el caso de uso clave de las capacidades nativas de la nube como el manejo de grandes cantidades de datos, ya sean pilas de imágenes o conjuntos de datos científicos multidimensionales. Pero el hecho de que se puedan almacenar todos los datos en la nube no significa que se desee utilizar todos los datos todo el tiempo. OGC API – Environmental Data Retrieval (EDR) permite realizar subconjuntos complejos de cubos de datos para devolver (o señalar) solo lo que se necesita.

¿Necesitas fusionar los sensores de Internet de las cosas con tus enormes reservas de contenido? Aprovecha OGC SensorThings API EstándaresTenga en cuenta que la combinación de fuentes de datos dispares y sensores dinámicos normalmente necesita cierto grado de procesamiento para extraer información útil, por lo que debe implementar OGC API – Processes Trabajar entre y dentro de múltiples conjuntos de datos y fuentes.

El procesamiento se presenta en muchos modelos, pero hoy en día es muy importante el uso de la Inteligencia Artificial para destilar grandes cantidades de datos y convertirlos en información útil. Grupo de trabajo sobre el dominio de la inteligencia artificial en geoinformática (GeoAI) está abordando algunos de los casos de uso e identificando objetivos de interoperabilidad e incluso de estandarización para el flujo y la calidad de la información. Por ejemplo, la caracterización de los datos de entrenamiento y validación utilizados en GeoAI ahora se está estandarizando en el Grupo de trabajo sobre estándares del lenguaje de marcado de datos de entrenamiento para IA. Como parte de este ecosistema, el procesamiento y análisis de datos altamente automatizados aporta beneficios extraordinarios a partir de los datos geoespaciales nativos de la nube.

Los formatos también son de vital importancia. Hice referencia a un par de blogs de Chris Holmes en la parte superior de esta publicación donde hay excelentes descripciones de varias codificaciones nativas de la nube de uso amplio (o que pronto lo serán). Comprenda que no es solo la estructura de estas codificaciones lo que las hace "nativas de la nube", sino también los medios por los cuales se accede a los datos (generalmente nativos de la web, es decir, HTTP). Por lo tanto, muchas codificaciones del estándar OGC, como GeoPackage, puede ser nativo de la nube. A continuación, destaco varios formatos que actualmente están madurando en OGC.

OGC estandarizado geoTIFF En 2019 y desde entonces, ha estado trabajando para estandarizar Cloud Optimized GeoTIFF (COG) para la gestión de datos ráster. Comenzando con el COG Biblioteca, OGC ha estado trabajando para documentar el formato como un estándar formal y está a punto de completar este trabajo. Un borrador de especificación está disponible como Informe de ingeniería de la especificación GeoTIFF optimizada para la nube de OGC Testbed-17;El Estándar no se quedará atrás.

Se ha demostrado que los datos multidimensionales más complejos se pueden codificar de manera eficiente en la nube utilizando zarZarr también está en la votación final para su aprobación como Norma comunitaria OGCEl banco de pruebas más reciente completado por OGC evaluó la idoneidad de Zarr para manejar cubos de datos geoespaciales en el Banco de pruebas OGC 17: Informe de ingeniería de evaluación de COG/Zarr y Zarr lo hizo muy bien... al igual que COG.

Los datos de características (vectoriales) ya se manejan en la nube en todos los tipos de bases de datos que dependen de ella. Características simples de OGC, el estándar más ampliamente implementado de OGC, para codificar la geometría. Pero, ¿esta gestión es realmente nativa de la nube, en particular con respecto a la transmisión de datos a los usuarios? Se están considerando otras codificaciones. GeoParquet Actualmente se está incubando en OGC como un posible formato vectorial nativo de la nube. Otros formatos, como Geobuf plano También se están considerando como posibles Normas Comunitarias, para unirse a las Normas existentes como Capas de escena 3D indexadas y 3D Tiles, ambos ofrecen capacidades nativas de la nube, particularmente con la entrega de datos.

Poniéndolo todo junto en el mundo real

Ha leído hasta aquí y ve un montón de referencias a estándares y especificaciones individuales que abordan partes específicas del ecosistema geoespacial nativo de la nube. Poner todo junto requiere la aplicación práctica de estas tecnologías, estándares y especificaciones en conjunto. El funcionamiento del ecosistema de la nube requiere la coordinación de muchas disciplinas y, a veces, nuevos diseños de arquitectura en relación con nuestro uso anterior de sistemas monolíticos (como microservicios y sistemas altamente componibles). Aquí es donde la otra mitad del OGC es tan crítica. Programa de Innovación de la OGC Opera numerosas iniciativas cada año para experimentar o poner a prueba las capacidades mencionadas anteriormente en escenarios del mundo real y entregar documentación y ejemplos que se pueden reutilizar para muchos casos de uso.

Una búsqueda de “nube” en el Repositorio de informes de ingeniería Devuelve referencias a 20 documentos, cada uno de los cuales destaca la aplicación práctica de las capacidades destacadas anteriormente y más. Estos documentos se pueden poner en el contexto del ecosistema nativo de la nube como se ilustra a continuación.

Como puede ver, las iniciativas del Programa de Innovación han tocado muchos aspectos del ecosistema de la nube, aunque solo estén relacionados de manera periférica con la tecnología de ubicación. Estos informes de ingeniería hacen referencia a aún más trabajos relevantes e identifican prácticas específicas que se pueden trasladar a muchos casos de uso. También recomiendo el reciente Paquete de aplicaciones de OGC sobre mejores prácticas para la observación de la Tierra, que detalla el empaquetado y la implementación de plataformas de explotación de observación de la Tierra, generalmente en un entorno de nube.

Desarrollo y Maduración

En resumen, he mencionado muchos estándares y recursos y hay muchos más en el OGC y a través de nuestras organizaciones asociadas. Cada uno, literalmente CADA UNO, de estos esfuerzos requiere una inversión considerable de tiempo y recursos. La dedicación de los miembros del OGC para avanzar en este trabajo está cada vez más representada en el ecosistema de la nube. El hecho de que tantos proveedores importantes de servicios en la nube (por ejemplo, AWSGoogleMicrosoftOracle) son miembros de la OGC y destacan la relevancia de los esfuerzos de la OGC en este ámbito.

Los estándares se están perfeccionando y contamos con la orientación de expertos sobre la implementación y la gestión de las capacidades. Esperamos contar con recursos dedicados para desarrolladores e implementadores de OGC para fomentar el uso consistente de contenido geoespacial en los ecosistemas de la nube. Continuaremos investigando las mejores prácticas, publicando orientación e identificando las capacidades que ofrecen nuestros miembros para sustentar toda la industria de la ubicación.