GlobalBuildingAtlas est un jeu de données complet offrant une couverture mondiale des polygones de bâtiments (GBA.Polygon), des hauteurs (GBA.Height) et des modèles 3D de bâtiments à un niveau de détail 1 (GBA.LoD1). Il s'agit du premier jeu de données ouvert à offrir des données de haute qualité, cohérentes et complètes sur les bâtiments en 2D et 3D et à l'échelle mondiale. Ce jeu de données a été développé à l'aide de pipelines basés sur l'apprentissage automatique appliqués à l'imagerie satellite mondiale PlanetScope, offrant une résolution spatiale et une couverture sans précédent pour l'analyse des bâtiments.
Extrait de GlobalBuildingAtlas (GBA) sur Google Earth Engine
Se fier uniquement à la surface bâtie en 2D peut être trompeur. Un quartier informel densément peuplé et un quartier résidentiel planifié avec des immeubles de plusieurs étages peuvent paraître identiques vus du ciel. Comprendre la véritable forme urbaine exige des données verticales. Le Global Building Atlas comble des lacunes critiques dans les bases de données mondiales existantes sur le bâtiment en fournissant des informations 3D complètes à l'échelle de chaque bâtiment, ce qui permet des applications en urbanisme, modélisation énergétique, évaluation des risques de catastrophe et recherche sur le changement climatique. Avec plus de 2,75 milliards de polygones de bâtiments dans le monde, ce jeu de données dépasse de plus d'un milliard le nombre de structures des bases de données mondiales existantes sur le bâtiment.
La couche fondamentale repose sur l'imagerie de réflectance de surface de PlanetScope. Les chercheurs ont divisé la Terre en cellules de grille de 0,2 degré, en sélectionnant des zones qui chevauchent des régions bâties connues. Ils ont ensuite téléchargé environ 800 000 images satellites de 2019, toutes à une résolution de 3 mètres. Aucun jeu de données open source ne possède une couverture mondiale parfaite. Ils ont donc combiné plusieurs sources vectorielles pour établir une base de référence : OpenStreetMap, Google Open Buildings, Microsoft Building Footprints et CLSM. Ils ont également généré leurs propres polygones pour compléter les 40 zones manquantes. Pour générer leurs propres cartes de bâtiments, l'équipe a utilisé un réseau neuronal encodeur-décodeur (UPerNet avec une architecture ConvNeXt-Tiny). Ils ont entraîné ce modèle sur plus de 142 000 fragments d'images satellites répartis dans 107 régions du monde afin de prédire des masques binaires de bâtiments. Les prédictions brutes issues d'images satellites comportent souvent du bruit, et les bâtiments adjacents ont tendance à se confondre. Pour remédier à ce problème, les chercheurs ont entraîné un second réseau de régularisation afin de réduire le bruit des masques, puis ont appliqué un algorithme de simplification polygonale pour créer des contours vectoriels nets et denses. Les modèles d'apprentissage automatique confondent parfois les nuages, la neige ou l'eau avec des bâtiments. Les chercheurs ont utilisé la carte mondiale d'occupation des sols World Cover pour éliminer les faux positifs, c'est-à-dire les polygones situés entièrement en dehors des zones bâties connues. Prédire la hauteur des bâtiments à partir d'un espace 2D exige des données d'entraînement d'une précision extrême. L'équipe a collecté des nuages de points LiDAR aériens dans 168 villes du monde entier. Ces données ont été traitées pour créer des modèles numériques de surface normalisés, afin d'apprendre à l'IA à estimer la hauteur à partir d'un seul point. Ils ont déployé une architecture HTC-DC Net pour l'estimation de hauteur monoculaire. Celle-ci utilise un encodeur de transformation visuelle pour capturer les relations entre les caractéristiques locales et globales. Cela permet de prédire une distribution des hauteurs possibles pour chaque pixel, qui est ensuite affinée pour obtenir une hauteur finale.
Aperçu des données disponibles sur Github
Visualisation des données sur Google Earth Engine :
https://sat-io.earthengine.app/view/gba
Visualisation des données sur un visualisateur dédié :
https://tubvsig-so2sat-vm1.srv.mwn.de/
Données disponibles sur Github ou MediaTUM
https://github.com/zhu-xlab/GlobalBuildingAtlas
https://mediatum.ub.tum.de/1782307
Référence scientifique :
Zhu, X.X., Chen, S., Zhang, F., Shi, Y., Wang, Y. (2025). « GlobalBuildingAtlas : An Open Global and Complete Dataset of Building Polygons, Heights and LoD1 3D Models » [GlobalBuildingAtlas : un ensemble de données ouvert, global et complet de polygones, de hauteurs et de modèles 3D LoD1 de bâtiments]. Earth System Science Data, 17, 6647–6668, 2025 https://essd.copernicus.org/articles/17/6647/2025/
Articles connexes
Microsoft met en téléchargement 800 millions d'empreintes de bâtiments
Cartographier les bâtiments en Afrique à partir d'images satellites
Une cartographie très précise des densités à l'échelle mondiale pour améliorer l'aide humanitaire
L'histoire par les cartes : le plan et les bâtiments d'Amsterdam par dates de construction
Mise à disposition de la Base de données nationale des bâtiments (BDNB) en open data
Comparer la skyline des grandes villes à partir de la modélisation 3D de leur bâtiments
SandDance, l'outil d'exploration visuelle open source de Microsoft

