In einer Zeit, in der synthetische Bilder, Deepfakes und immer komplexere KI-Workflows unsere digitale Landschaft dominieren, ist die Frage des Vertrauens in Daten wichtiger denn je. Wie können wir uns auf die Daten verlassen, die unsere wichtigsten Entscheidungen beeinflussen – vom Hochwasser- und Waldbrandmanagement über die nationale Sicherheit bis hin zu Notfallmaßnahmen und Infrastrukturplanung?
Denken Sie an die katastrophalen Überschwemmungen in Deutschland im Jahr 2021. Trotz moderner Warnsysteme tauchten Zweifel an der Genauigkeit und Aktualität der Daten auf, die den Hochwasservorhersagemodellen zugrunde lagen. Dies trug zu Verzögerungen bei Evakuierungen und dem Verlust von über 180 Menschenleben bei. In Australien erschwerten Lücken und Ungenauigkeiten in den Satellitenbildern während der Buschbrände 2020 den Rettungskräften die effektive Planung und den Einsatz ihrer Ressourcen.
Ebenso viel steht auf dem Spiel, was die nationale Sicherheit und die öffentliche Information betrifft. 2022 verbreitete sich ein Deepfake-Video eines prominenten Politikers im Internet, erschütterte kurzzeitig das öffentliche Vertrauen und warf dringende Fragen nach Authentizität und Herkunft auf. Während der COVID-19-Pandemie sorgten Fehlinformationen und inkonsistente Datenberichterstattung für Verwirrung und erschwerten die Koordinierung einer wirksamen Reaktion des öffentlichen Gesundheitswesens. Dies sind keine Randszenarien – sie bieten einen Vorgeschmack darauf, was passiert, wenn Datenintegrität, -herkunft und -vertrauen nicht von vornherein in unsere Systeme integriert sind.
Aus diesem Grund entwickelt das Open Geospatial Consortium (OGC) einen umfassenden Rahmen für Integrität, Herkunft und Vertrauen (IPT) in Geodaten. Ziel dieser Arbeit ist es, eine Grundlage zu schaffen, auf die sich Organisationen weltweit verlassen und auf der sie aufbauen können, um sicherzustellen, dass ihre Daten nicht nur nützlich, sondern auch vertrauenswürdig sind.
Dies ist der Beginn einer einjährigen Initiative, um zu definieren, wie vertrauenswürdige Geodaten wirklich aussehen – und wie wir als globale Gemeinschaft sicherstellen können, dass sie die Grundlage für die Systeme bilden, auf die wir alle angewiesen sind.
Warum es jetzt wichtig ist
Unternehmen verlassen sich heute auf ein immer umfangreicheres und vernetzteres Datenökosystem – oft beziehen sie Daten von externen Anbietern oder verarbeiten sie über Blackbox-KI-Modelle. Dieser Komfort hat jedoch seinen Preis: Können wir sicher sein, dass die Daten das sind, was sie vorgeben zu sein?
Wir haben bereits gefälschte Satellitenbilder, KI-generierte 3D-Stadtmodelle und synthetische Straßennetze gesehen. Dies sind nicht nur theoretische Risiken – sie stellen eine echte Herausforderung für das öffentliche Vertrauen, die operative Genauigkeit und die Rechenschaftspflicht dar.
In Umgebungen mit hohem Risiko kann Unsicherheit über Datenintegrität oder -herkunft zu fehlerhaften Analysen, übersehenen Warnungen oder sogar Richtlinienversagen führen. Es ist Zeit, von blindem Vertrauen zu evidenzbasiertem Vertrauen überzugehen.
Beginnen wir mit einigen Definitionen und einem Beispiel, um die Perspektive von OGC beim Aufbau dieses Frameworks darzulegen.
Integrität Bezieht sich auf den Umgang mit Daten während ihres gesamten Lebenszyklus, einschließlich ihrer Eigenschaften wie Inhalt, Genauigkeit und Vollständigkeit von der Erfassung über die Verarbeitung bis hin zur Verteilung. Die Integrität kann durch Manipulationen, Fehler oder undokumentierte Änderungen beeinträchtigt werden. Daher sind Sicherheitsvorkehrungen zur Gewährleistung der Zuverlässigkeit unerlässlich.
Herkunft bezieht sich auf den Ursprung der Daten, die Art und Weise ihrer Veränderung sowie darauf, wer oder was diese Veränderungen vorgenommen hat. Die Herkunft ist gefährdet, wenn Vorgänge, die die Daten verändern, nicht aufgezeichnet werden, was sowohl die Rückverfolgbarkeit als auch die Integrität beeinträchtigt.
Wenn Integrität und Herkunft gut dokumentiert, konsistent und unveränderlich sind, besteht eine Grundlage für Vertrauen können in Daten. Vertrauen bedeutet nicht nur, dass der Nutzer sicher ist, dass die Daten seinen Erwartungen entsprechen, sondern auch, dass Herkunft, Entstehung und Eignung der Daten eindeutig beschrieben werden können, sodass auch andere die Daten nutzen können.
Beispielsweise nimmt ein Satellit mit bekannten Kameraparametern ein Bild auf. Dieses Bild wird direkt an eine Organisation weitergeleitet, die es mithilfe eines genau definierten Algorithmus an ein Geländemodell anpasst. Das angepasste Bild wird dann verwendet, um die Größe eines Sees zu berechnen. Dabei wird berücksichtigt, dass die Quelle eine bestimmte Pixelauflösung hat und dass die Daten während der Verarbeitung so bearbeitet wurden, dass die ursprüngliche Auflösung erhalten blieb. Wenn jeder dieser Vorgänge – von der Erfassung über die Verarbeitung bis zur Bereitstellung – anhand standardisierter und eindeutiger Parameter dokumentiert wird, können Nutzer darauf vertrauen, dass die Daten ihren Anforderungen entsprechen und Analysen validiert und reproduziert werden können.
VERTRAUEN IN GEODATEN AUFBAUEN: FORTSCHRITTE UND NÄCHSTE SCHRITTE
OGC und andere haben bedeutende Fortschritte bei der Entwicklung gemacht Grundsätze, Tools und Frameworks, die die IPT in Geodaten verbessern. Diese Bemühungen bilden die Grundlage für die Gewährleistung der Datenzuverlässigkeit, Rückverfolgbarkeit und Nutzbarkeit branchenübergreifend. Einige Aspekte des IPT-Frameworks sind bereits vorhanden oder werden bald eingeführt, wie beispielsweise die folgenden.
Integrität
Metadatenstandards definieren die ursprünglichen und transformierten Daten. Es gibt etablierte Standards für die Erfassung von Metadaten, es müssen jedoch Richtlinien für die effektive Verwendung gemeinsamer Terminologie entwickelt werden, um einen direkten Vergleich zu ermöglichen.
OGCs Sensormodell Das Register gewährleistet konsistente Beschreibungen der Sensorfunktionen. Dieses Register löst einen Teil des Problems, es müssen jedoch ähnliche Definitionen für andere Datenquellen und -erfassungsmethoden entwickelt oder integriert werden.
Herkunft
OGCs Training Data Markup Language für KI standardisiert Trainings- und Validierungsdatensätze. Im OGC werden neue Arbeiten zur Entwicklung spezialisierter Metadaten zur Beschreibung der in der Geodatenverarbeitung verwendeten KI-Modelle vorgeschlagen.
Das Datenqualitätsmaßregister von OGC und ISO erstellt quantifizierbare, konsistente Beschreibungen der Datenqualität. Diese Qualitätsmaße beschreiben die Integrität der Daten und die Auswirkungen der Verarbeitung, die die Herkunft der Informationen bestimmt.
Provenienzbausteine werden von OGC in mehreren Projekten der Europäischen Union implementiert. OGC API-Standards bestehen aus mehreren unabhängig implementierbaren Funktionsbausteinen, die gemeinsam zu einer Implementierung zusammengesetzt werden können. Ebenso können Deskriptoren von Operationen, die die Integrität beeinflussen und Teil der Datenherkunft sind, modular aufgebaut und in jeden Schritt des Datenlebenszyklus eingefügt werden.
Was kommt als nächstes
Trotz dieser Fortschritte ist ein umfassendes Vertrauensmodell – basierend auf interoperablen, standardbasierten IPT-Komponenten – noch nicht fertiggestellt.
Im nächsten Jahr wird OGC mit Mitgliedern und Partnern zusammenarbeiten, um:
- Integrieren Sie IPT-Bausteine in Betriebssysteme und Arbeitsabläufe
- Stellen Sie sicher, dass die Deskriptoren maschinenlesbar, manipulationssicher und umsetzbar sind
- Paketieren Sie IPT-Parameter mit Datensätzen für durchgängige Transparenz
- Spiegeln Sie reale Benutzeranforderungen durch offene Zusammenarbeit und gemeinsame Tests wider
Seien Sie Teil der Zukunft vertrauenswürdiger Daten
In diesem Blog geht es um eine tiefere Auseinandersetzung mit dem Rahmenwerk für Integrität, Herkunft und Vertrauen und darum, wie wir als Gemeinschaft gemeinsam etwas Sinnvolles – und Skalierbares – aufbauen können.
Wir veröffentlichen das ganze Jahr über technische Highlights, Anwendungsfälle aus der Praxis und Möglichkeiten zur Beteiligung. Egal, ob Sie Normen entwickeln, Daten nutzen, KI-Experte sind oder im öffentlichen Dienst arbeiten – Ihr Wissen ist entscheidend.
Der Bewegung beitreten:
Sorgen wir dafür, dass Datenvertrauen sichtbar, messbar und gemeinsam nutzbar ist, damit jeder mit Zuversicht bessere Entscheidungen treffen kann.