Country T-SNE, une solution de data visualisation originale pour comparer des pays entre eux


La théorie de la similarité entre les pays, vous connaissez ?

C'est l'idée que les pays ayant des caractéristiques similaires sont plus à même de commercer les uns avec les autres (cela semble une approche plutôt libérale). Mais l'objectif est également de pouvoir conduire des approches comparées en s'assurant qu'il existe un minimum de comparabilité entre les pays ou inversement de permettre de faire des analyses contrastives à partir de groupes de pays ayant des caractéristiques dissemblables. Ces caractéristiques peuvent correspondre au niveau de développement ou d'éducation, au mode de gestion des ressources naturelles ou au respect de l'environnement, au régime politique ou au mode de gouvernance, et à bien d'autres critères...

C'est sur principe que la société Interacta, dont l'objectif est de fournir des solutions de visualisation interactive fondées sur les données, a mis au point l'application Country T-SNE. Les auteurs Nikita Rokotyan, Olya Stukova, Dasha Kolmakova ont eu recours à l'algorithme T-SNE, une méthode non-linéaire qui permet de représenter un grand nombre de variables sous forme de nuage de points.

Pour accéder à la data visualisation :
http://projects.interacta.io/country-tsne/

 

Au début, l'interface peut surprendre et on a du mal à comprendre ce que représentent les données affichées à l'écran. En effet, l'application est fondée sur T-SNE, un algorithme d'apprentissage automatique issu de l'intelligence artificielle qui permet de regrouper visuellement des points de données similaires sans rien connaître a priori des données réelles. 

Chaque point à l'écran  représente un pays, mais il ne s'agit pas d'une carte (donc pas de localisation géographique). S'il fallait comparer avec un type de graphique, le rendu visuel se rapproche du nuage de points, mais sans indication des variables ni des unités utilisées en abscisses et en ordonnées. Il s'agit en fait de graphes.

Les indicateurs, tels que la population, la superficie, le PIB, l'IDH, l'indice de GINI, l'indice Happy Planet..., sont accessibles à droite de l'écran. En choisissant un nouvel indicateur, les regroupements entre pays s'affichent automatiquement. Il faut considérer chaque pays comme un point de données possédant un certain nombre de propriétés. T-SNE recherche les similitudes locales et globales entre les pays et effectue les rapprochements directement sur la carte. Les couleurs représentent les différents continents, la taille du point est  proportionnelle à la population du pays. Ces paramètres sont modifiables. Le moteur de recherche permet heureusement d'identifier un pays si on ne le trouve pas à l'écran. Un conseil : décocher d'abord toutes les cases, puis afficher indicateur par indicateur avant de passer éventuellement à plusieurs indicateurs à la fois.

Si vous êtes amateurs de #dataviz et d'indicateurs composites, cette application devrait vous ravir. Parmi les nombreuses options de paramétrage figure notamment la "perplexité". Celle-ci permet d'équilibrer les relations locales et globales dans les données qui sont liées au nombre de voisins les plus proches. Les valeurs sont comprises entre 5 et 50. L'algorithme T-SNE (t-distributed stochastic neighbor embedding) se base en effet sur une interprétation probabiliste des proximités.

Présentée dans le cadre d'un concours le World Data Visualization Prize, cette application entend être une solution de cartographie alternative fondée sur l'analyse des données. Elle a d'ailleurs remporté le grand prix devant les autres projets qui étaient en lisse dans ce concours.

Les données ont été fournies par le site Information is beautiful et par le World Government Summit.


Lien ajouté le 1er février 2020


Articles connexes :

Que valent toutes ces cartes sur Internet qui comparent des pays par leur taille ?

Un jeu géographique pour localiser des pays, reconnaître leurs drapeaux et les comparer

Utiliser des graphiques animés pour donner à voir des évolutions et des ruptures