Geonames, une base mondiale pour chercher des noms de lieux géographiques

Le site GeoNames.org constitue une base de données géographiques gratuite et en libre accès sur Internet. Cette base regroupe 25 millions de noms géographiques, soit plus de 11 millions de lieux avec leurs coordonnées géographiques (dont 4,8 millions de lieux habités) et 13 millions de lieux autres, non géoréférencés.
L'interface du site est assez simple. Il suffit de saisir un nom de lieu ou un toponyme (par exemple ici les noms de lieux comportant le mot "ville"), puis une zone géographique (la France ou le monde par exemple). Aussitôt les résultats s'affichent sur une page avec l'ensemble des lieux, leur pays d'origine, leurs coordonnées géographiques (en projection WG84) et leur population (s'il s'agit de lieux habités) : 890 lieux géographiques comportent le mot "ville" en France (aussi bien en préfixe qu'en suffixe, comme par exemple "Francheville" ou "Villefranche" par exemple). Mais ils sont 25 905 dans le monde !


Les résultats peuvent être directement visualisés sur une carte Google Maps et téléchargés sous forme de fichier KML pour être réutilisés dans Google Earth ou dans un SIG. Un API permet également d'interroger l'interface à distance et d'incorporer la carte dans un site. Geonames propose des cartes thématiques déjà faites concernant les noms des plus hautes montagnes, des grandes villes, des capitales... S'agissant des toponymes en "villes" que nous cherchions, ils sont clairement plus nombreux dans le Nord et l'Est de la France.


Les noms de lieux avec leurs coordonnées géographiques sont classés en 9 catégories et 645 sous-catégories. Ils sont téléchargeables sous forme de fichiers txt par ordre alphabétique sur le site Geonames Dump. Attention : cela représente plusieurs gigaoctets de données !

Un point important est à souligner : bien qu'elle soit très large, la base GeoNames n'offre pas une couverture égale pour tous les pays. Les États-Unis ont la meilleure couverture avec plus de 2 millions de lieux géographiques. Après les États-Unis, les pays les plus couverts sont la Chine, l’Inde, le Mexique, la Russie, le Canada et la Thaïlande. En Europe, c'est de loin la Norvège qui a été la mieux renseignée dans la base, en Afrique c'est le Maroc. 



GeoNames puise ses informations dans une longue liste de sources, qui va de fournisseurs officiels de données géographiques (comme par exemple l'IGN) à des fournisseurs privés (par exemple des chaînes d'hôtels). Cette disparité des sources est à l'origine d'une couverture assez inégale. En France, l'un des outils les plus pratiques reste le géocatalogue proposé par le Géoportail. L'IGN a produit en outre un glossaire des noms de lieux. La BD NYME de l'IGN a été remplacée par le thème "Toponymes" de la BD TOPO (plus précise que Geonames pour chercher des toponymes à l'échelle locale).
 

Rassurez-vous, si vous ne souhaitez pas traiter les 11 millions de noms de lieux géographiques compris dans la base Geonames, certains passionnés des Big Data ont commencé à le faire pour vous. C'est le cas de Topi Tjukanov, expert dans l'exploitation de grosses bases de données géospatiales. Nous avons déjà présenté l'une de ces productions dans un billet sur les data visualisations pour étudier l'expansion urbaine. L'auteur a publié sur son blog le 20 novembre 2018 un article donnant quelques-uns de ses résultats  : Places and their names - observations from 11 million place names (voir son billet).

Malgré ses limites, GeoNames est une excellente source d'informations pour chercher et afficher des noms de lieux à l'échelle mondiale. Topi Tjukanov a utilisé PostGis pour effectuer les requêtes SQL et QGIS pour représenter les données sous forme de cartes. A l'échelle mondiale, la densité des noms est telle qu'elle reproduit en quelque sorte l'empreinte humaine à la surface du globe (c'est quasiment l'oekumène qui se donne à voir à travers la façon dont l'homme a exploré et nommé les lieux).



C'est ainsi qu'on apprend que les noms répertoriés dans Geonames comportent en moyenne 13 caractères. 21 noms ont seulement un caractère et 3 072 en ont deux. Voici la carte d'Europe des noms qui comportent seulement trois caractères. 

Certains toponymes sont récurrents comme par exemple ceux qui portent le nom d'un saint en Amérique du Sud (cf préfixe en San- ou en Santa-). Aux Etats-Unis, le nom de "Washington" se retrouve près d'une quarantaine de fois et ne désigne pas que la capitale fédérale. Topi Tjukanov a cherché par ailleurs à reconstituer l'aire géographique de toponymes ou de suffixes caractéristiques d'une langue ou d'une culture. Pour l'Europe du Nord, il propose un gif animé très intéressant qui montre l'extension des toponymes en by, havn, hus ou en borg. C'est une manière de travailler sur les toponymes scandinaves et de mesurer l'extension des noms d'origine viking sur lesquels il y a tant de discussions et d'incertitudes. A propos du toponyme de "ville" concentré dans le Nord de la France et tout particulièrement en Normandie, voici la carte que l'auteur nous livre. Mais on peut retrouver le toponyme de l'Afrique (Libreville, Brazzaville...) jusqu'aux États-Unis (Knoxville, Nashville...).



Vous connaissez peut-être le film "Paris, Texas" de Wim Wenders, mais savez-vous par exemple combien de lieux géographiques ont le nom de "Paris" dans le monde ? Vous serez surpris du résultat : 15 844 ! En réalité le moteur de recherche fonctionne en plein texte et recense toutes les occurrences, aussi bien les monuments, les gares, les arrondissements de la capitale que les places ou les hôtels dans le monde qui font référence à Paris.  Pour être vraiment pertinente, la base Geonames a donc besoin de faire l'objet de requêtes attributaires par l'utilisateur. Il faut donc soit télécharger la base de données et lui appliquer des traitements dans un tableur, soit utiliser le moteur interne du site en lui appliquant des filtres.



A vous de jouer maintenant avec la base de données GeoNames... 


Lien ajouté le 16 décembre 2018

Wikidata Query Service peut rendre un service équivalent à GeoName. Ce service permet d'interroger la base de données de tous les noms compris dans OpenStreetMap à l'échelle du monde et notamment de la France. Il suffit de choisir un terme et une commune. Voici par exemple l'ensemble des communes françaises dont le nom finit en -ac.

Pour plus de détail sur ce site : Utiliser Wikidata pour chercher des informations géographiques.



Lien ajouté le 18 janvier 2019

Une carte des noms de lieux aux Etats-Unis sous forme de story map.
http://nation.maps.arcgis.com/apps/Cascade/index.html

Les noms pour désigner les trouées, brèches, passages et autres cols montagneux diffèrent en fonction des régions aux Etats-Unis.

Lien ajouté le 30 janvier 2019

Ce site permet de créer des cartes à partir des noms de communes. L'interface offre la possibilité de faire des comparaisons entre trois types de toponymes (indiqués de 3 couleurs différentes). On peut  utiliser des préfixes ou des suffixes (par exemple des noms de communes commençant par ville- ou finissant par -ac...).  Les noms de lieux sont fournies par la base de données d'OpenStreetMap.
http://ssz.fr/places/



Liens ajoutés le 16 août 2019 :

Ce fil Twitter aborde la question des noms de rues ou de quartiers utilisés qui sont empruntés à de grosses bases de données (tels Wikidata, Geonames...) et qui renvoient à une toponymie souvent curieuse, voire idiomatique.
 
 

Le site Saints & Sinners indique l'emplacement des villes et villages avec le préfixe "saint", "san" ou santa" en Europe et aux Etats-Unis. La base de noms utilisée est celle d'OpenStreetMap.



 
Lien ajouté le 30 novembre 2019


Liens ajoutés le 18 janvier 2020





Lien ajouté le 24 mars 2020

Suffixes les plus communs dans les noms de communes en France. A télécharger en haute résolution sur MapPorn.


Articles connexes