Article rédigé par Chris Holmes, chercheur invité de l'OGC -
Il y a environ six mois, j'ai commencé comme premier « Visiting Fellow » de l'Open Geospatial Consortium. Ce fut un réel plaisir d'explorer plus en profondeur divers aspects de l'OGC, en travaillant avec le personnel et les membres. Le temps a filé, et j'ai donc voulu partager mes progrès et quelques réflexions sur ce qui va suivre.
La portée ouverte de la bourse était incroyable, mais j'ai réalisé que je devais rapidement me concentrer si je voulais avoir un impact réel tout en travaillant une demi-journée par semaine pendant six mois. Le thème qui en est ressorti, je l'appelle « Cloud-Native OGC », explorant les composants fondamentaux qui permettent d'établir des normes géospatiales sur le cloud, à un niveau « inférieur » aux API.
Il s’agit d’une évolution des idées que j’ai présentées il y a quatre ans dans une série de blogs intitulée «Géospatiale native du cloud', lequel ouvert avec la question : « À quoi ressemblerait le monde géospatial si nous construisions tout de A à Z sur le cloud ? ». Depuis, j’ai consacré l’essentiel de mon temps à deux aspects fondamentaux de cette transformation : GeoTIFF optimisés pour le cloud et Catalogues d'actifs spatio-temporels. Nous avons assisté à une adoption très précoce de ces deux formats, mais elle s'est principalement concentrée sur l'imagerie satellite multispectrale, qui ne représente qu'une petite partie du monde géospatial global. J'ai donc consacré mon temps en tant que chercheur invité de l'OGC à une réflexion sur cette question initiale : « Que serait l'imagerie géospatiale ? Normes « Est-ce qu'ils semblent avoir été conçus pour le cloud ? » J'ai pu prendre le temps d'examiner l'ensemble du paysage géospatial, pas seulement l'imagerie, et le potentiel de l'OGC à jouer un rôle de leader clé pour faire de la vision géospatiale native du cloud une réalité.
La vision géospatiale native du Cloud
En creusant un peu plus, j'ai découvert que les travaux de normalisation existants de l'OGC pourraient facilement évoluer pour aligner l'industrie sur les architectures géospatiales natives du cloud. Aucune organisation n'est mieux placée que l'OGC pour concrétiser ce projet : elle est déjà reconnue par tous les gouvernements comme le garant des normes géospatiales et dispose de la plus grande communauté d'experts géospatiaux travaillant ensemble, dans les secteurs commercial, à but non lucratif, gouvernemental et universitaire.
Avant d’entrer dans les détails des normes nécessaires pour soutenir cela, il convient d’articuler en détail l’état futur rendu possible par cette vision.
La mission de l'OGC est de « rendre les informations de localisation trouvables, accessibles, interopérables et réutilisables (FAIR) ». Cloud-Native Geospatial partage exactement le même objectif, mais exploite le cloud pour simplifier radicalement l'effort nécessaire pour rendre les données géospatiales FAIR. Au lieu de forcer les fournisseurs de données à créer, maintenir et faire évoluer leurs propres API, l'exigence devrait être aussi simple que d'utiliser le bon format géospatial natif du cloud et les bonnes métadonnées, et de les télécharger sur n'importe quel cloud. Toutes les API et l'évolutivité proviennent du cloud lui-même, ce qui permet à la géospatiale de surfer sur les vagues continues d'innovation dans le monde informatique au lieu de jouer continuellement à « rattraper son retard ».
L'un des principaux objectifs de la géospatiale native du cloud est de réduire la charge pesant sur les fournisseurs de données et, par conséquent, de permettre à un plus grand nombre de données géospatiales d'être équitables. Le seul coût que les fournisseurs devraient avoir à payer est celui de la stockage cloud, qui se situe actuellement entre 1 et 5 dollars par mois pour 100 gigaoctets de données. Si ces données de base sont hébergées sur le cloud, les technologies cloud natives générales permettent de renverser l'équation des coûts, car les utilisateurs des données paient pour chaque calcul qu'ils effectuent, et avec 'le demandeur paie« les utilisateurs paient même pour le frais de sortie.
Une fois que les données sont dans les bons formats géospatiaux natifs du cloud, il est facile pour quiconque de mettre en place un serveur géospatial traditionnel, idéalement un serveur rendant les données disponibles sous forme d'API OGC. Mais les données elles-mêmes deviennent FAIR, même si elles ne se trouvent pas dans une API avancée, car le cloud et les normes clés fournissent tout ce qui est nécessaire pour fournir les données.
Mais les choses deviennent vraiment passionnantes lorsqu'on pense à une toute nouvelle classe d'outils géospatiaux natifs du cloud qui peuvent se superposer aux données de base de FAIR, en plus des services géospatiaux traditionnels. Google Earth Engine fonctionne dans ce futur depuis des années, permettant des calculs à l'échelle mondiale qui s'exécutent simultanément sur des dizaines de milliers de nœuds de calcul pour fournir des réponses en quelques secondes. Ils ont fait un travail incroyable en organisant une une énorme quantité de données, mais GEE a toujours été un jardin clos où seules les données ingérées dans GEE pouvaient exploiter ses capacités. Dans la vision géospatiale native du cloud, toutes les données sur le cloud pourraient être utilisées par GEE (et ils ont en effet commencé à adopter la vision CNG avec Inscription au COG).
Plus important encore, tout nouvel outil de calcul à l'échelle du cloud comme GEE n'aurait pas besoin de créer son propre catalogue de données car il pourrait simplement accéder aux mêmes formats géographiques natifs du cloud que ceux utilisés par d'autres outils. Disposer d'une suite d'outils géospatiaux natifs du cloud avec un hébergement de données bon marché ouvre alors le potentiel d'une bien plus grande queue plus longue Les petites entreprises qui disposent d'informations précieuses mais n'ont pas les moyens d'exploiter des serveurs adopteront les données géospatiales natives du cloud, car le fait de placer leurs données sur le cloud permettra de disposer de nombreux outils et analyses formidables. L'accès à toutes les informations du monde en un seul endroit, combiné à des calculs à échelle infinie, devrait à son tour ouvrir la voie à une toute nouvelle vague d'outils innovants qui vont au-delà de l'analyse géospatiale traditionnelle pour trouver des modèles plus larges. Ensuite, la frontière entre les informations géospatiales et non géospatiales s'estompera une fois qu'elles seront natives du cloud, ce qui amplifiera considérablement l'impact potentiel des informations géospatiales - mais cela mériterait à lui seul un article de blog.
L'obtention d'une masse critique de données réellement exploitables par les outils avancés du cloud ouvre alors la possibilité d'une véritable « recherche géospatiale ». Le paradigme principal aujourd'hui est que vous devez connaître ou trouver un serveur géospatial particulier, puis vous pouvez effectuer des recherches géospatiales pour trouver les informations dont vous avez besoin. Il n'existe pas de « Google pour les informations de localisation » car il n'existe pas de format standard à « explorer » comme il existe le HTML pour le Web. Les métadonnées simples et les formats de données qui résident sur le cloud fournissent la « capacité d'exploration » de base, en particulier lorsqu'ils ont un équivalent HTML qui est explorable par les moteurs de recherche Web traditionnels, comme le décrit le Bonnes pratiques en matière de données spatiales sur le Web.
L’avantage principal de la géospatiale native du cloud pour la recherche est l’accès aux données réelles : vous pouvez les diffuser directement dans divers outils qui fournissent une valeur réelle. Les tentatives précédentes de moteurs de recherche géospatiale affichaient au mieux une image d’aperçu, et souvent seulement une description textuelle, et souvent les données réelles n’étaient même pas disponibles pour un téléchargement direct : il s’agissait simplement d’une recherche de métadonnées. Avec la géospatiale native du cloud, l’outil de recherche peut diffuser des données en pleine résolution directement dans le navigateur, ou se connecter à des outils plus puissants qui permettent une analyse basée sur le cloud des résultats de recherche. La vision géospatiale native du cloud se concentre d’abord sur l’acheminement d’une masse critique de données vers le cloud, mais une fois qu’il existe des masses d’informations suffisamment précieuses, elle ouvre la possibilité d’une toute nouvelle classe de technologies et d’entreprises axées sur des outils de recherche géospatiale plus innovants.
Vers une base de référence pour les normes géospatiales natives du cloud
Comment pouvons-nous réellement progresser vers cette vision ? Les normes fondamentales sont bien plus proches que l’on pourrait le penser. Mais il faut souligner que la réalisation de cette vision nécessitera beaucoup plus de travail de la part de l’ensemble du secteur géospatial que la simple publication de quelques normes. Nous devons déployer des efforts soutenus pour apporter chaque élément d’information de localisation dans le cloud dans des formats standard, pour mettre à jour chaque outil afin de pouvoir l’utiliser et pour créer ensemble toute une nouvelle classe d’outils de nouvelle génération qui démontrent la puissance de disposer de pétaoctets d’informations sur le monde en un seul endroit.
Cela signifie qu’il faut une base solide sur laquelle s’appuyer, permettant de superposer des couches et des couches d’innovation. Mais cette base standard doit également être adaptable au paysage technologique global, pour pouvoir suivre les tendances technologiques plus vastes (comme le passage de XML à JSON et à tout ce qui suivra). La clé pour cela est de construire de petites pièces qui sont faiblement couplées, avec peu de pièces mobiles, et de se concentrer vraiment sur les composants véritablement géospatiaux. Cette approche est d’une simplicité radicale, en mettant en place les unités atomiques de base pour permettre une innovation inimaginable.
Je vais me plonger dans un plan pratique pour parvenir à une base de référence minimale viable pour les données géospatiales natives du cloud, en tirant parti de tout le travail formidable accompli par l'OGC et la communauté géospatiale au sens large. Mais mon travail dans le cadre de la bourse au cours des derniers mois montre que nous sommes potentiellement proches de la base de référence, et si nous travaillons ensemble pour y parvenir et construire l'écosystème interopérable d'outils autour de celui-ci, la puissance des informations géospatiales sera accessible à tous. Ceux d'entre nous qui travaillent sur le terrain connaissent cette puissance, et si nous pouvons créer une interopérabilité cloud native simple qui permette à chacun d'accéder facilement à nos données, alors l'impact sur le monde sera incommensurable.