Créée en 2019, l'agence de presse non lucrative et non partisane The City souhaite être « au service de tous les New Yorkais ». Elle s'est donné pour priorité de garder à l'esprit la diversité géographique lorsque ses rédacteurs et journalistes attribuent, écrivent, photographient ou éditent des articles. Afin de pouvoir vérifier cette égalité de couverture dans le traitement de l'information, la plateforme numérique a demandé à ChatGPT de trouver et de cartographier tous les emplacements mentionnés dans ses articles depuis 2019.
Le résultat est Where AI Mapped Our Stories, une carte interactive des 2 773 emplacements identifiés à partir de 4 159 articles du journal en ligne The City. La carte présente deux vues principales : une vue choroplèthe montrant la densité de couverture par quartier et une vue en mode points localisant les 2 773 lieux cités dans le journal sur la période 2019-2023.
Densité de couverture par quartier entre 2019 et 2023 (source : Where AI Mapped Our Stories)
Selon l’analyse produite par l'IA, les articles publiés semblent couvrir l'ensemble de la ville de New York et ne pas se limiter aux quartiers aisés qui ont tendance à attirer le plus l’attention des médias. Cependant certains quartiers sont moins mentionnés que d’autres, l’est du Queens et Staten Island étant relativement absents. La densité de couverture journalistique est particulièrement forte dans le CBD, ce qui reflète la centralité de la presqu'île de Manhattan.
Il est à noter que ChatGPT n'a pas été en mesure de géolocaliser toutes les histoires. Il n'a pu reconnaître que les lieux explicitement nommés dans les articles. Il a fait des erreurs sur certains lieux indistincts ou au contraire en multipliant les lieux lorsque ceux-ci apparaissaient dans le même article sans que l'histoire s'y réfère précisément. L'analyse s'est heurtée aussi au problème des noms de quartiers correspondant à des limites géographiques assez floues. Le New York Times en a fait une carte qui donne une représentation de ce phénomène de frontières fluides entre quartiers (An Extreme Detailed Map of New York). Il a donc fallu procéder à des vérifications et recourir en complément à des méthodes plus traditionnelles. Pour autant, le recours à l'IA a permis de gagner du temps par rapport à l'écriture d'un code spécifique dans une application dédiée. Cela nécessite cependant de soigner l'écriture des instructions qui doivent être claires et explicites. Voici le prompt qui a été donné à ChatGPT :
Vous êtes un data scientist et un cartographe. A partir de ce texte, effectuez une analyse sémantique et renvoyez les données géographiques : 'Quartier :', 'Nom de la rue :', 'Landmark :', 'Coordonnées géographiques :'. Pas d’autres textes s’il vous plaît
Le recours à l'agent conversationnel ChatGPT d'OpenAI a été jugé globalement positif par The City d'après l'article qui présente le détail de cette expérience : « À une époque où le journalisme considère l'IA comme un substitut potentiel aux coûts des reportages produits par l'homme, en tant que rédaction à but non lucratif, nous considérons les technologies comme un moyen de remplir notre mission : l'IA générative peut aider à créer des outils comme cette carte qui nous permet d'être plus réactifs envers les communautés que nous servons ». Il est vraisemblable que l'IA va se développer considérablement dans les années qui viennent pour chercher, sélectionner et représenter des données géolocalisées. Non sans entraîner des changements profonds pour le métier de data journaliste et pour de nombreux autres métiers manipulant du code informatique et des données géonumériques.
Lien ajouté le 8 mars 2024
Pour aller plus loin
IA et géographie
— Sylvain Genevois (@mirbole01) September 16, 2023
Pas encore testé, mais s'il devient possible avec l'IA de choisir une liste de lieux, d'en faire compléter les coordonnées géo et de produire directement un fichier kml utilisable dans un globe virtuel, pas de doute que cela va plaire !https://t.co/JWSorEAq0m https://t.co/eJA6XCx2wr
We Asked an AI to Map Our Stories Across NYC (The City)
GeoLLM: Extracting Geospatial Knowledge from Large Language Models (arXiv:2310.06213)
Explainable spatially explicit geospatial artificial intelligence in urban analytics (Urban analytics lab)
Articles connexes
Pour aider à géolocaliser des photographies, Bellingcat propose un outil de recherche simplifié à partir d'OpenStreetMap
Des outils d'IA gratuits pour identifer un lieu à partir d'une photographie
Des cartes du monde dans le style d'artistes célèbres créées par intelligence artificielle