By Tamrat Belayneh (Tecnólogo principal, Esri), Konrad Wenzel (Director, Centro de investigación y desarrollo de Esri en Stuttgart GmbH), amanda morgan (Director sénior, Estándares abiertos, Bentley Systems/Cesium), adam morris (Ingeniero principal, Plataforma Cesium, Bentley Systems/Cesium), Azad Balabanian (Gerente sénior de productos Niantic Spatial, Inc.)
Las Salpicaduras Gaussianas 3D son una innovadora tecnología de representación 3D emergente en el ámbito de la captura de la realidad. A diferencia de las geometrías sólidas tradicionales, las Salpicaduras Gaussianas 3D utilizan campos de radiancia para representar la complejidad de entornos reales con un detalle fotorrealista sin precedentes. Este sofisticado método captura características sutiles como estructuras delgadas, materiales semitransparentes, reflejos y texturas intrincadas, aspectos que antes representaban un desafío para las técnicas de captura 3D convencionales y los mecanismos de almacenamiento popularizados en las mallas fotogramétricas. Su capacidad única para representar contenido espacial de alta fidelidad con un renderizado eficiente ha despertado un amplio interés en las comunidades geoespaciales, gráficas y de estándares.
Reconociendo el potencial transformador de las salpicaduras gaussianas 3D, las organizaciones líderes en los dominios geoespaciales, gráficos y estándares, incluidos Consorcio Geoespacial Abierto (OGC), Grupo Khronos®, Niantic Espacial, Cesio (Bentley) y Esri— se han unido para integrar 3D Geoespacial Gaussian Splats en la plataforma ampliamente adoptada de Khronos. glTF™ Estándar de formato de activos 3D. Esta iniciativa colaborativa busca crear un marco estandarizado e interoperable para codificar y compartir salpicaduras gaussianas 3D, garantizando una amplia interoperabilidad y una fácil implementación en diversas plataformas y aplicaciones.
SPZ y glTF: Eficiencia, simplicidad y flexibilidad
Un elemento central de esta iniciativa es la adopción de la Formato SPZ, un formato de archivo de código abierto proporcionado por Niantic Spatial bajo la licencia MIT, que comprime las salpicaduras gaussianas 3D hasta en un 90 % en comparación con PLY, a la vez que conserva la fidelidad visual y el rendimiento. La simplicidad y eficiencia de SPZ lo hacen ideal para su adopción generalizada, ya que logra un equilibrio entre el rendimiento computacional y la visualización de alta calidad.
La combinación de las fortalezas de SPZ con la estructura flexible de glTF permitirá una implementación interoperable y sencilla que permite la extensibilidad futura a través de la posible inclusión de campos de datos adicionales para adaptarse a diversos requisitos de los usuarios y flujos de trabajo personalizados.
Nuevas extensiones glTF de salpicadura gaussiana en desarrollo
El Grupo de Trabajo de Formatos 3D de Khronos está desarrollando dos nuevas extensiones destinadas a estandarizar la entrega de salpicaduras gaussianas dentro de los activos glTF:
- KHR_salpicadura gaussiana, que define la estructura para almacenar salpicaduras gaussianas 3D en glTF, tratándolas como primitivas de puntos con atributos como posición, rotación, escala, transparencia y armónicos esféricos (compatible con componentes difusos y especulares). Esta estructura también permite una transición fluida a la representación dispersa de nubes de puntos.
- Compresión de salpicadura gaussiana KHR_spz, que permite un almacenamiento y una transmisión eficientes mediante el formato SPZ. Los blobs SPZ se almacenan como búferes dentro de las primitivas glTF y pueden descomprimirse en atributos o pasarse directamente a las canalizaciones de renderizado. Admite la codificación flexible de armónicos esféricos (de ninguno a tres grados) según las necesidades del contenido.
Estas extensiones son de vanguardia y están diseñadas para servir como base para el soporte a largo plazo de la salpicadura gaussiana 3D en glTF. Su objetivo es proporcionar una capa base extensible y de alto rendimiento para la representación espacial de alta fidelidad, con margen para desarrollar capacidades más complejas a medida que la tecnología madure.
Para validar el enfoque, el grupo colaborativo realizó evaluaciones exhaustivas en diversos conjuntos de datos geoespaciales. Un desafío recurrente surgió en escenarios con características largas y lineales comunes en contextos geoespaciales (como antenas, cercas, líneas eléctricas y vías férreas), que presentaban artefactos visuales inadecuados para una visualización y un análisis precisos. Capturar estas salpicaduras alargadas sin aumentar significativamente el tamaño de la carga útil resultó difícil.
Para abordar este problema, el grupo introdujo una mejora mínima pero crítica a precisión de rotación en el formato SPZ, que fue lanzado recientemente como Versión 2.0.0 de la biblioteca SPZ. Con este cambio, las rotaciones en SPZ ahora se codifican utilizando los tres componentes más pequeños de un cuaternión normalizado, cada uno almacenado como un entero con signo de 10 bits, mientras que el componente más grande se deriva y su índice se almacena utilizando 2 bits, optimizando la precisión. En contraste, las versiones anteriores de SPZ utilizaban el valor fijo. (X y Z) componentes del cuaternión, omitiendo también los derivados w componente, pero con una codificación menos precisa.
Las evaluaciones de seguimiento demostraron mejoras sustanciales en la calidad de los datos, lo que refuerza la practicidad y adaptabilidad de la solución para aplicaciones geoespaciales del mundo real.
Involúcrate
A medida que este trabajo evoluciona, agradecemos activamente los comentarios y las contribuciones de la comunidad en general para ayudar a dar forma a las nuevas extensiones propuestas de glTF. Ya sea investigador, desarrollador, colaborador de estándares o profesional de 3D, sus ideas son esenciales para crear una especificación robusta que aborde las necesidades del mundo real. Todos son bienvenidos. Conviértete en miembro del grupo Khronos y tomar un papel directo en el desarrollo de extensiones participando en el Grupo de trabajo de formatos 3D de Khronos. También puedes contribuir participando en debates en Estándares OGC, y colaboración abierta en GitHub:
Sobre Nosotros Khronos
El Grupo Khronos es un consorcio abierto, sin fines de lucro e impulsado por sus miembros, compuesto por más de 150 empresas líderes de la industria que crean estándares de interoperabilidad sin regalías para gráficos 3D, realidad aumentada y virtual, computación paralela, procesamiento de visión y aprendizaje automático. Las actividades de Khronos incluyen 3D Commerce™, ANARI™, glTF™, NNEF™, OpenCL™, OpenGL®, OpenGL® ES, OpenVG™, OpenVX™, OpenXR™, SPIR-V™, SYCL™, Vulkan® y WebGL™. Los miembros de Khronos impulsan el desarrollo y la evolución de las especificaciones de Khronos y pueden acelerar la entrega de plataformas y aplicaciones de vanguardia mediante el acceso temprano a los borradores de especificaciones y pruebas de conformidad.
Acerca de Consorcio Geoespacial Abierto (OGC)
El Consorcio Geoespacial Abierto (OGC) es una comunidad global e intersectorial de más de 500 organizaciones que trabajan para impulsar los estándares abiertos y la innovación en tecnología geoespacial. Durante más de 30 años, OGC ha unido a la industria, los gobiernos, el mundo académico y la investigación para resolver desafíos complejos mediante la interoperabilidad, la colaboración y las pruebas en el mundo real. Desde la resiliencia climática y la respuesta ante desastres hasta las ciudades inteligentes, los gemelos digitales, los sistemas autónomos y la visualización 3D avanzada, los estándares e iniciativas de innovación de OGC facilitan el intercambio y el uso fluidos de información geoespacial en diversas plataformas y dominios. Al conectar diversas experiencias y tecnologías, OGC ayuda a las organizaciones a tomar mejores decisiones, mejorar la calidad de vida y crear un futuro más resiliente y sostenible. Más información
Sobre Nosotros Esri
Esri, miembro influyente del OGC y líder mundial en soluciones geoespaciales durante más de cinco décadas, cuenta con una amplia experiencia en la resolución de complejos desafíos geoespaciales y continúa impulsando la innovación para facilitar el acceso sin problemas a conjuntos de datos geoespaciales masivos en diversas plataformas, como navegadores web, dispositivos móviles y aplicaciones de escritorio. Este avance colaborativo refuerza el compromiso constante de Esri con la mejora de la interoperabilidad y la accesibilidad geoespaciales, estableciendo nuevos referentes en la representación y el uso de datos geoespaciales.
Sobre Nosotros Sistemas Bentley (Cesium)
Cesium es la plataforma para geoespacial 3D. Creamos 3D Tiles, el estándar de la comunidad OGC para la transmisión masiva de datos geoespaciales 3D. Los creadores utilizan Cesium para construir con datos reales a escala, en diferentes sectores, como AEC, aeroespacial, defensa, medioambiente, telecomunicaciones y más. Bentley Systems adquirió Cesium en septiembre de 2024. Fundada en 1984 por ingenieros para ingenieros, Bentley es el socio predilecto de empresas de ingeniería y propietarios-operadores de todo el mundo, con software que abarca disciplinas de ingeniería, sectores industriales y todas las fases del ciclo de vida de la infraestructura.
Sobre Nosotros Niantic Espacial
Niantic Spatial es pionera en IA geoespacial y desarrolla tecnología que permite tanto a personas como a máquinas percibir y comprender espacios físicos de formas completamente nuevas. Nuestra tecnología principal se basa en un mapa digital de tercera generación, y el Sistema de Posicionamiento Visual (SVP) ofrece una precisión centimétrica en la localización en el mundo real. Estamos desarrollando un Modelo Geoespacial de Gran Tamaño (MGD) para ofrecer una comprensión semánticamente rica y con base espacial de las ubicaciones reales.
Marcas registradas:
Khronos® y Vulkan® son marcas registradas, y ANARI™, WebGL™, glTF™, KTX™, NNEF™, OpenVX™, SPIR™, SPIR-V™, SYCL™, OpenVG™, Karamos™ y 3D Commerce™ son marcas comerciales de The Khronos Group Inc. OpenXR™ es una marca comercial propiedad de The Khronos Group Inc. y está registrada en China, la Unión Europea, Japón y el Reino Unido. OpenCL™ es una marca comercial de Apple Inc. y OpenGL® es una marca registrada, y los logotipos de OpenGL ES™ y OpenGL SC™ son marcas comerciales de Hewlett Packard Enterprise, utilizadas bajo licencia por Khronos. Todos los demás nombres de productos, marcas comerciales o nombres de empresas se utilizan únicamente con fines de identificación y pertenecen a sus respectivos propietarios.