Die Training Data Markup Language for Artificial Intelligence (TrainingDML-AI) Der Standard zielt darauf ab, das UML-Modell und Kodierungen für Trainingsdaten für georäumliches maschinelles Lernen zu entwickeln. Trainingsdaten spielen eine grundlegende Rolle bei der Erdbeobachtung (EO), künstlichen Intelligenz und maschinellem Lernen (KI/ML), insbesondere Deep Learning (DL). Sie werden zum Trainieren, Validieren und Testen von KI/ML-Modellen verwendet. Dieser Standard definiert ein UML-Modell und Kodierungen, die mit der OGC-Standard-Basislinie übereinstimmen, um die Trainingsdaten in der Webumgebung auszutauschen und abzurufen.
Der TrainingDML-AI-Standard bietet detaillierte Metadaten zur Formalisierung des Informationsmodells von Trainingsdaten. Dies umfasst unter anderem die folgenden Aspekte:
- So führen Sie externe Klassifizierungsschemata und flexible Mittel zur Darstellung der Ground-Truth-Beschriftung ein.
- Wie die Trainingsdaten vorbereitet werden, beispielsweise Herkunft oder Qualität;
- So geben Sie unterschiedliche Metadaten an, die für unterschiedliche ML-Aufgaben verwendet werden, z. B. Szenen-/Objekt-/Pixelebenen;
- Wie man zwischen dem hochrangigen Trainingsdaten-Informationsmodell und den erweiterten Informationsmodellen, die für verschiedene ML-Anwendungen spezifisch sind, unterscheidet; und