Données sur les bâtiments à l'échelle mondiale (Global Building Atlas)


GlobalBuildingAtlas est un jeu de données complet offrant une couverture mondiale des polygones de bâtiments (GBA.Polygon), des hauteurs (GBA.Height) et des modèles 3D de bâtiments à un niveau de détail 1 (GBA.LoD1). Il s'agit du premier jeu de données ouvert à offrir des données de haute qualité, cohérentes et complètes sur les bâtiments en 2D et 3D et à l'échelle mondiale. Ce jeu de données a été développé à l'aide de pipelines basés sur l'apprentissage automatique appliqués à l'imagerie satellite mondiale PlanetScope, offrant une résolution spatiale et une couverture sans précédent pour l'analyse des bâtiments.

Extrait de GlobalBuildingAtlas (GBA) sur Google Earth Engine

Se fier uniquement à la surface bâtie en 2D peut être trompeur. Un quartier informel densément peuplé et un quartier résidentiel planifié avec des immeubles de plusieurs étages peuvent paraître identiques vus du ciel. Comprendre la véritable forme urbaine exige des données verticales. Le Global Building Atlas comble des lacunes critiques dans les bases de données mondiales existantes sur le bâtiment en fournissant des informations 3D complètes à l'échelle de chaque bâtiment, ce qui permet des applications en urbanisme, modélisation énergétique, évaluation des risques de catastrophe et recherche sur le changement climatique. Avec plus de 2,75 milliards de polygones de bâtiments dans le monde, ce jeu de données dépasse de plus d'un milliard le nombre de structures des bases de données mondiales existantes sur le bâtiment.

La couche fondamentale repose sur l'imagerie de réflectance de surface de PlanetScope. Les chercheurs ont divisé la Terre en cellules de grille de 0,2 degré, en sélectionnant des zones qui chevauchent des régions bâties connues. Ils ont ensuite téléchargé environ 800 000 images satellites de 2019, toutes à une résolution de 3 mètres. Aucun jeu de données open source ne possède une couverture mondiale parfaite. Ils ont donc combiné plusieurs sources vectorielles pour établir une base de référence : OpenStreetMap, Google Open Buildings, Microsoft Building Footprints et CLSM. Ils ont également généré leurs propres polygones pour compléter les 40 zones manquantes. Pour générer leurs propres cartes de bâtiments, l'équipe a utilisé un réseau neuronal encodeur-décodeur (UPerNet avec une architecture ConvNeXt-Tiny). Ils ont entraîné ce modèle sur plus de 142 000 fragments d'images satellites répartis dans 107 régions du monde afin de prédire des masques binaires de bâtiments. Les prédictions brutes issues d'images satellites comportent souvent du bruit, et les bâtiments adjacents ont tendance à se confondre. Pour remédier à ce problème, les chercheurs ont entraîné un second réseau de régularisation afin de réduire le bruit des masques, puis ont appliqué un algorithme de simplification polygonale pour créer des contours vectoriels nets et denses. Les modèles d'apprentissage automatique confondent parfois les nuages, la neige ou l'eau avec des bâtiments. Les chercheurs ont utilisé la carte mondiale d'occupation des sols World Cover pour éliminer les faux positifs, c'est-à-dire les polygones situés entièrement en dehors des zones bâties connues. Prédire la hauteur des bâtiments à partir d'un espace 2D exige des données d'entraînement d'une précision extrême. L'équipe a collecté des nuages ​​de points LiDAR aériens dans 168 villes du monde entier. Ces données ont été traitées pour créer des modèles numériques de surface normalisés, afin d'apprendre à l'IA à estimer la hauteur à partir d'un seul point. Ils ont déployé une architecture HTC-DC Net pour l'estimation de hauteur monoculaire. Celle-ci utilise un encodeur de transformation visuelle pour capturer les relations entre les caractéristiques locales et globales. Cela permet de prédire une distribution des hauteurs possibles pour chaque pixel, qui est ensuite affinée pour obtenir une hauteur finale.

Aperçu des données disponibles sur Github

Visualisation des données sur Google Earth Engine :
https://sat-io.earthengine.app/view/gba

Visualisation des données sur un visualisateur dédié :
https://tubvsig-so2sat-vm1.srv.mwn.de/

Données disponibles sur Github ou MediaTUM
https://github.com/zhu-xlab/GlobalBuildingAtlas
https://mediatum.ub.tum.de/1782307

Référence scientifique :

Zhu, X.X., Chen, S., Zhang, F., Shi, Y., Wang, Y. (2025). «  GlobalBuildingAtlas : An Open Global and Complete Dataset of Building Polygons, Heights and LoD1 3D Models » [GlobalBuildingAtlas : un ensemble de données ouvert, global et complet de polygones, de hauteurs et de modèles 3D LoD1 de bâtiments]. Earth System Science Data, 17, 6647–6668, 2025 https://essd.copernicus.org/articles/17/6647/2025/

Lien ajouté le 17 février 2026

Zhaiyu Chen, Yuanyuan Wang, Yilei Shi, Xiao Xiang Zhu (2026). « Reconstructing Building Height from Spaceborne TomoSAR Point Clouds Using a Dual-Topology Network » [Reconstruction de la hauteur des bâtiments à partir de nuages ​​de points TomoSAR spatiaux à l'aide d'un réseau à double topologie]. IEEE Transactions on Geoscience and Remote Sensinghttps://arxiv.org/abs/2601.00658

La création de cartes de villes en 3D est notoirement difficile et coûteuse. Elle repose généralement sur des relevés LiDAR aéroportés, difficiles à mettre en œuvre à grande échelle. Mais aujourd'hui, des chercheurs ont mis au point une méthode permettant de cartographier la hauteur des bâtiments à partir d'images radar satellites. Une nouvelle étude acceptée dans IEEE Transactions on Geoscience and Remote Sensing présente un cadre pour la reconstruction des hauteurs de bâtiments à l'aide de nuages ​​de points TomoSAR (Tomographic Synthetic Aperture Radar). Cette technique superpose plusieurs images radar satellitaires pour créer des nuages ​​de points 3D. Le problème réside dans la qualité médiocre des données brutes. Elles souffrent d'un bruit important, d'une relative rareté et d'un échantillonnage irrégulier. Pour résoudre ce problème, ils ont conçu un réseau neuronal à double topologie. Les modèles classiques traitent les données soit comme une grille (images), soit comme des points. Ce modèle combine les deux approches. Il alterne les informations entre la représentation sous forme de grille et celle sous forme de points afin de préserver les détails tout en atténuant le bruit. Ils ont testé cette méthode sur deux jeux de données : Berlin (données de haute qualité) et Munich (données de faible qualité et bruitées). Pour les données bruitées de Munich, le modèle a eu des difficultés à localiser les bâtiments au départ. Ils ont donc ajouté une « branche auxiliaire » au réseau. Cette branche auxiliaire oblige l'IA à prédire l'« emprise au sol » 2D du bâtiment en plus de sa hauteur 3D. Cette régularisation sert de guide : elle empêche le modèle de se tromper et l'aide à distinguer les bâtiments réels des interférences radar aléatoires. Les résultats montrent que le modèle parvient à combler efficacement les zones manquantes. À Berlin, l'erreur absolue moyenne (MAE) n'est que de 2,10 mètres. Même avec les données bruitées de Munich, les chercheurs sont parvenus à reconstituer des structures urbaines plausibles. Les auteurs ont également constaté que la fusion de ces données avec des images satellites optiques les améliore encore. L'ajout d'images de PlanetScope leur a permis de réduire davantage les erreurs. Les données optiques fournissent des informations sémantiques que le radar ne détecte pas. En définitive, il s'agit d'une avancée majeure pour la télédétection. Cela laisse entrevoir la possibilité de générer des modèles 3D de villes à l'échelle mondiale grâce aux satellites déjà en orbite, sans avoir à attendre des relevés aériens coûteux.

Articles connexes

Microsoft met en téléchargement 800 millions d'empreintes de bâtiments

Cartographier les bâtiments en Afrique à partir d'images satellites

Une cartographie très précise des densités à l'échelle mondiale pour améliorer l'aide humanitaire