Aufruf zur Teilnahme
Executive Summary
In der heutigen, zunehmend digitalen Welt ist der einheitliche Austausch und das Verständnis von Daten über Organisationen und Grenzen hinweg unerlässlich geworden. Eine Grundvoraussetzung für einen effektiven Datenaustausch ist die Verwendung klarer und allgemein verständlicher Terminologien, sogenannter „Vokabulare“. Derzeit gibt es keinen allgemein akzeptierten internationalen Standard oder einheitlichen Ansatz für die Verwaltung und Verteilung dieser Vokabulare über Online-Dienste. Dieser Mangel an Standardisierung führt zu Verwirrung, Redundanz und Ineffizienz, da Organisationen Schwierigkeiten haben, Daten aus verschiedenen Quellen zu kombinieren, zu verwalten und zu interpretieren. Um einen entscheidenden Punkt hervorzuheben: Obwohl wir einen allgemein akzeptierten Standard für Vokabulardienste (d. h. die digitalen Dienste, die Zugriff auf Vokabulare bieten) entwickeln möchten, streben wir ausdrücklich keinen einzigen universellen Satz von Vokabularen an – unser Ziel ist vielmehr, Vielfalt zu fördern und die Wiederverwendung zu unterstützen, was letztlich die Interoperabilität verbessert.
Um diese Herausforderungen zu bewältigen, schlägt das Open Geospatial Consortium (OGC) die Entwicklung eines neuen internationalen Standards – eines „Vocabulary Service Standard“ – vor, der die gemeinsame Nutzung, Verwaltung und Nutzung von Vokabularen über verschiedene Systeme hinweg vereinfachen soll. Dieser Standard etabliert einheitliche Methoden für den Zugriff auf Vokabularinformationen, die Nachverfolgung von Änderungen sowie die Dokumentation von Quellen und Aktualisierungen. Durch die Standardisierung von Vokabulardiensten will das OGC die Interoperabilität verbessern. Das bedeutet, dass verschiedene Systeme und Organisationen die Daten der jeweils anderen nahtlos verstehen und nutzen können. Gleichzeitig werden Komplexität und Kosten der Daten- und Terminologieverwaltung deutlich reduziert.
Der vorgeschlagene Vocabulary Service-Standard wird technischen Experten, politischen Entscheidungsträgern und Organisationen zugutekommen, indem er eine klarere Kommunikation ermöglicht, die Verwaltung von Datenressourcen verbessert und eine stärkere Zusammenarbeit und Innovation über Sektoren und internationale Grenzen hinweg fördert.
Einführung
Ein Vokabulardienst ist ein digitaler Dienst, der Zugriff auf strukturierte Begriffssätze – sogenannte Vokabulare – bietet, mit denen Daten systemübergreifend konsistent beschrieben, kategorisiert und kommentiert werden können. Diese Vokabulare können kontrollierte Vokabulare, Taxonomien, Thesauri, Ontologien und Codelisten umfassen.
Ein Vokabeldienst ermöglicht Benutzern und Systemen typischerweise:
- Entdecken Sie Vokabeln, die für eine Domäne oder Aufgabe relevant sind
- Zugriff auf Vokabelinhalte in standardisierten Formaten (z. B. SKOS, JSON-LD, RDF)
- Suchen und Durchsuchen von Begriffen, Definitionen, Beziehungen und Metadaten
- Lösen Sie Kennungen (z. B. URIs) für bestimmte Begriffe auf, um menschen- und maschinenlesbare Beschreibungen abzurufen
- Wiederverwendung und Referenzierung von Begriffen in ihren eigenen Daten oder Metadaten
- Vokabulare im Laufe der Zeit versionieren und pflegen
Ein Vokabulardienst zielt darauf ab, die semantische Interoperabilität zu fördern – die Fähigkeit von Systemen, Daten mit eindeutiger, gemeinsamer Bedeutung auszutauschen – indem Vokabulare über verschiedene Domänen und Anwendungen hinweg auffindbar, zugänglich und nutzbar gemacht werden. Trotz dieser Bedeutung existiert derzeit kein moderner Standard für die gemeinsame Nutzung von Vokabularen über APIs, und keine internationale Standardisierungsorganisation hat eine Arbeitsgruppe, die sich mit dieser Lücke befasst. Bestehende Community-Initiativen spiegeln eine fragmentierte Landschaft wider, in der viele verschiedene Muster zur Wiederverwendung von Vokabular verwendet werden. Die folgende Abbildung veranschaulicht die Situation. Muster 1 integriert alle anderswo gefundenen Elemente in einem Copy-Paste-Wiederverwendungsansatz. Muster 2 veranschaulicht einen Wiederverwendungsansatz durch Abgleich, der Elemente in einem Repository den Elementen in einem anderen zuordnet. In Muster 3 werden explizite Filter verwendet, während Muster 4 die klassische Mischung aus teilweise vereinbarten Vokabularen, Teilkopien vorhandener Vokabulare und schließlich ausgewählten Optionen zeigt, die keine Verbindung mehr zu ihren ursprünglichen Quellen haben.
Die Vielfalt der Muster stellt ein erhebliches Hindernis für die Interoperabilität dar. Jede Kopie eines Vokabulars birgt das Risiko, dass Änderungen am Original unbemerkt bleiben oder in den Kopien Anpassungen vorgenommen werden, die nicht auf das Original zurückgeführt werden können. Erforderlich sind kanonische Formen von Herkunftsmetadaten und robuste Synchronisationsmechanismen, um die Föderation und Subset-Erstellung über verteilte Systeme hinweg zu unterstützen. Ein Standard für föderierte Vokabulardienste muss Zugriff, Synchronisation und Subset-Identifizierung konsistent regeln. Darüber hinaus sind Governance- und Herkunftsrahmen unerlässlich, um die Integrität und Rückverfolgbarkeit von Vokabularen zu gewährleisten. Angesichts der geografischen Dimension vieler Vokabulare ist die Föderation für OGC besonders relevant. Die Abstimmung dieser Dienste mit anderen OGC-APIs würde die Interoperabilität des gesamten OGC-Ökosystems stärken. Um diesen Anforderungen gerecht zu werden, wird die Einrichtung einer OGC-Standards-Arbeitsgruppe vorgeschlagen, die Vokabulardienstmodelle entwickelt und testet und mit externen Standardisierungsgruppen zusammenarbeitet. Dies würde die Kompatibilität mit der RAINBOW-Infrastruktur des OGC sicherstellen und die Entwicklung föderierter, herkunftsbewusster Vokabulardienste als Teil einer global kohärenten Open-Data-Umgebung unterstützen.
Die folgende Liste zeigt die Logik hinter dem geplanten Aufwand:
- Daten teilen heißt, das Verständnis der Terminologie teilen
- Vokabeldienste bieten Zugriff auf Vokabeln
- Es gibt keinen akzeptierten modernen Servicestandard für den Austausch von Vokabularen über API
- Es gibt keine internationale Normungsorganisation mit Arbeitsgruppen, die an einem Vokabeldienststandard arbeiten
- Mehrere Initiativen finden in den Praxisgemeinschaften statt
- Der Austausch von Vokabeln erfordert oft die Aggregation aus mehreren Quellen
- Große, aggregierte Vokabulare erfordern bei Verwendung in spezifischeren Kontexten häufig die Deklaration „relevanter Teilmengen“.
- Föderation und Subsetting erfordern kanonische Formen von Provenienzmetadaten und Synchronisierung
- Föderierte Vokabulare erfordern eine Standardisierung des Zugriffs, der Synchronisierung und der Identifizierung von Teilmengen größerer Vokabulare.
- Governance- und Herkunftsregelungen müssen geschaffen werden
- Die Föderation ist in vielen Fällen von Natur aus ein geografisches Anliegen; daher hat OGC ein besonderes Interesse
- Federation Vocabulary-Dienste, die mit anderen OGC-APIs kompatibel sind, erweitern die Leistungsfähigkeit OGC-fähiger Ökosysteme.
- Dieser Vorschlag zielt darauf ab, eine OGC-Arbeitsgruppe zu gründen, die Ideen testen und Verbindungen zu anderen relevanten Normungsgruppen suchen kann.
Ziel dieses Vorschlags ist es, das internationale Bewusstsein für das Problem gemeinsam genutzter und wiederverwendeter Vokabulare zu schärfen und eine Lösung in Form eines standardisierten Vokabulardienstes zu schaffen.
Hintergrund
In einem zunehmend vernetzten digitalen Ökosystem, mit einer gemeinsamen Terminologie, die standardisiert zugänglich ist durch Vokabeldienste, spielt eine zentrale Rolle bei der Sicherstellung der konsistenten Kommunikation, Integration und Interpretation von Informationen zwischen verschiedenen Systemen. Da Daten über Organisations-, Länder- und Fachgrenzen hinweg ausgetauscht werden, muss die Bedeutung von Begriffen klar, präzise und interoperabel bleiben. Vokabulardienste bieten die Mechanismen zur Verwaltung, Veröffentlichung und Pflege kontrollierter Vokabulare, Taxonomien, Ontologien und Codelisten, die die semantische Interoperabilität unterstützen. Ohne sie sind Bemühungen zur Harmonisierung von Datensätzen, zur Entwicklung wiederverwendbarer Dienste oder zur Ermöglichung föderierter Wissenssysteme fragmentiert, fehleranfällig und nicht nachhaltig. Jeder Datennutzer trägt die Last der Recherche und Interpretation, ohne die Möglichkeit, Unklarheiten zu beseitigen. Effektive Vokabulardienste ermöglichen es verschiedenen Akteuren, auf gemeinsame Konzepte zu verweisen, Herkunft und Entwicklung von Begriffen zu verfolgen und ein maschinenlesbares Datenverständnis zu unterstützen. Sie bilden damit ein grundlegendes Element moderner Open-Data-Infrastrukturen, FAIR-Datenprinzipien (Findable, Accessible, Interoperable, Reusable) und semantischer Webtechnologien.
Die Herausforderung besteht jedoch darin, dass der aktuelle Stand der Technik für Vokabeldienste fragmentiert und unzureichend ist. Derzeit gibt es keinen standardisierten Vokabeldienst, der allgemein akzeptiert oder in der Praxis umgesetzt wird. Es gibt verschiedene Ansätze, die an bestimmte Softwareplattformen gebunden sind und Einblicke in eine wirklich interoperable Lösung geben können.
Bekannte Vokabular-Datenmodelle wie SKOS (Simple Knowledge Organization System), OWL (Web Ontology Language) und RDFS (Resource Description Framework Schema) definieren lediglich die Struktur und Beziehungen innerhalb von Vokabularen. Sie legen nicht fest, wie sich ein Dienst, der Vokabulare anbietet, verhalten oder funktionieren soll.
Ein großes Problem besteht darin, dass das „Web of Data“, das stark auf gemeinsamen Vokabularen basieren sollte, schwer zu realisieren ist, was teilweise auf das Fehlen eines gemeinsamen Vokabular-Servicemodells zurückzuführen ist. Dadurch wird die Interoperabilität, ein Grundprinzip, bei der Verwendung von Vokabularen verschiedener Systeme stark beeinträchtigt.
Voraussetzungen:
Bei der Analyse der aktuellen Situation müssen wir zwischen Standards für Vokabulare und Standards für Vokabulardienste unterscheiden. Die W3C-Standards, wie beispielsweise SKOS, bieten solide und implementierbare Vokabularstrukturen und können als Ausgangspunkt für Diskussionen dienen (Ausgangspunkt, da ihnen einige wesentliche Funktionen fehlen, insbesondere bei der Verwendung von Teilmengen bestehender Vokabulare). Demgegenüber gibt es verschiedene ISO-Standards. Diese ISO-Richtlinien sind hilfreich für die Prozessgestaltung, lassen sich aber nicht in Service-APIs oder Betriebsverhalten umsetzen.
Ziel ist die Definition eines Serviceansatzes, der unabhängig von einer bestimmten Softwareplattform ist. Obwohl viele europäische Institutionen dieselbe Plattform nutzen, ist die Verwendung einer einzigen Backend-Technologie nicht die Lösung. Stattdessen bedarf es einer standardisierten API und Verhaltensdefinition, unabhängig von der Implementierungstechnologie, um echte Interoperabilität zu ermöglichen.
Die Funktionalität eines Vokabulardienstes umfasst mehrere wichtige Funktionen. Ein Vokabulardienst muss in der Lage sein, einzelne Begriffe zu bedienen und Begriffsgruppen sowie deren Teilmengen zu verwalten. Er sollte verschiedene Teilmengen von Vokabularen anbieten und beschreiben und die Beziehungen zwischen ihnen, einschließlich Überschneidungen und Erweiterungen, erläutern.
Darüber hinaus muss der Dienst es Nutzern ermöglichen, nicht nur den Inhalt, sondern auch die Herkunftsinformationen abzurufen, die den Ursprung und die Verwaltungshistorie der Vokabulare und ihrer Teilmengen angeben. Fehlen solche Funktionen heute, müssen Nutzer Vokabulare manuell kopieren, was Wissen fragmentiert und eine effiziente Wiederverwendung verhindert. Der ideale Vokabulardienst muss diese komplexen Beziehungen, dynamischen Updates und Herkunftsinformationen unterstützen und so eine echte verteilte und föderierte Nutzung von Vokabularen in verschiedenen Organisationen ermöglichen.
Andere Initiativen
Andere Organisationen ziehen auch die Bereitstellung von Vokabeln und Vokabeldiensten in Betracht.
Ein Workshop zur Diskussion über die Vokabelföderation ist geplant (Einreichung steht noch aus) am SciDataCon 2025 (13.-16. Oktober 2025): Übersicht · Indico.
Zu den Teilnehmern gehören die OntoPortal-Allianz | OntoPortal, eine Föderation, die auf einer bestimmten Technologie mit wahrscheinlich hochrelevanten Anwendungsfällen und APIs basiert. Allerdings muss eine externe Standardisierungsorganisation die Dinge hosten.
API-Entwürfe für Vokabulardienste wurden in früheren Testumgebungen diskutiert. Sie wurden jedoch weder formal anhand der hier diskutierten Anforderungen geprüft noch ernsthaft für die Übernahme als SWG-Liefergegenstand in Betracht gezogen.
Vorschlag
Es wird vorgeschlagen, dass ein OGC-Standards-Arbeitsgruppe (SWG) eingerichtet werden, um eine Vocabulary Service API mit zwei Konformitätsklassen zu entwickeln:
- Wortschatzzugriff
- Wortschatzverwaltung
Diese SWG sollte auch definieren, wie auf Vokabulardienste, insbesondere Vereinigungen und Teilmengen von Vokabularen, in Dienst- und Datensatz-Metadatenstandards wie OGC API Records, STAC, ISO 19115 usw. verwiesen werden sollte.
Diese sollten als OGC-APIs implementiert werden, wobei der Building Block-Testansatz verwendet wird, um sicherzustellen, dass alle Lösungen auf Kompatibilität mit anderen getestet werden. OGC-API-Erweiterungen.
Diese SWG sollte durch formal finanzierte Aktivitäten von OGC Research unterstützt werden, um sicherzustellen, dass die Inputs und Outputs bestehende Forschungsergebnisse und Implementierungen wie OGC RAINBOW berücksichtigen. Gleichzeitig soll diese Initiative die Weiterentwicklung von OGC RAINBOW zu einer kompatiblen Infrastruktur unterstützen.
Die Aktivitäten sollten so weit wie möglich aktiv die Zusammenarbeit mit externen Akteuren anstreben. Die vorgeschlagene SWG kann unter der Schirmherrschaft bestehender OGC-Arbeitsgruppen wie „Architektur“ oder „Geosemantik DWG“ operieren. Sie kann über die OGC/W3C Spatial Data on the Web WG gemeinsam veröffentlicht und in allen Phasen von der W3C-Community aktiv als gemeinsame Aktivität gefördert werden.
Kommentare oder Fragen?
Bitte senden Sie eine E-Mail an in**@*gc.org mit Anmerkungen oder Fragen zu diesem Teilnahmeaufruf.
Anfrage zur Stellungnahme (RFC)
OGC bittet um öffentliche Stellungnahmen zu den vorgeschlagenen GeoHEIF-Standards...