Training Data Markup Language for Artificial Intelligence

Este estándar tiene como objetivo desarrollar el modelo de lenguaje de modelado unificado (UML) y las codificaciones para los datos de entrenamiento de aprendizaje automático geoespacial. Los datos de entrenamiento desempeñan un papel fundamental en el aprendizaje automático de inteligencia artificial (IA/ML) de observación de la Tierra (EO), especialmente en el aprendizaje profundo (DL). Se utilizan para entrenar, validar y probar modelos de IA/ML.

La Training Data Markup Language for Artificial Intelligence El estándar (TrainingDML-AI) tiene como objetivo desarrollar el modelo UML y las codificaciones para los datos de entrenamiento de aprendizaje automático geoespacial. Los datos de entrenamiento desempeñan un papel fundamental en el aprendizaje automático de inteligencia artificial (IA/ML) de observación de la Tierra (EO), especialmente en el aprendizaje profundo (DL). Se utilizan para entrenar, validar y probar modelos de IA/ML. Este estándar define un modelo UML y codificaciones coherentes con la línea base de los estándares OGC para intercambiar y recuperar los datos de entrenamiento en el entorno web.

El estándar TrainingDML-AI proporciona metadatos detallados para formalizar el modelo de información de los datos de entrenamiento. Esto incluye, entre otros, los siguientes aspectos:

  • Cómo introducir esquemas de clasificación externos y medios flexibles para representar el etiquetado de la verdad fundamental.
  • Cómo se preparan los datos de entrenamiento, como la procedencia o la calidad;
  • Cómo especificar diferentes metadatos utilizados para diferentes tareas de ML, como niveles de escena/objeto/píxel;
  • Cómo diferenciar el modelo de información de datos de entrenamiento de alto nivel y los modelos de información extendidos específicos para varias aplicaciones de ML; y