Récupérer les données d’un graphe “statique”

Vous voyez un graphe (interactif ou non, ça peut être simplement une image) et vous voulez en récupérer les données. Pour les importer dans un tableur et faire une version interactive de ce graphe, par exemple. Un miracle que permet, notamment, WebPlotDigitizer. Il permet aussi de mesurer, sur une photo, longueurs et distances.

Voici le graphe, issu d’un rapport pdf de l’IRM,  illustrant l’évolution sur 50 ans de la vitesse moyenne des vents en Belgique.
graphe1

our faire l’exercice, importez n’importe quel graphe sur internet ou enregistrez celui ci-dessus (bouton droit, enregistrer sous).
Téléchargez WebPlotDigitizer, décompressez le dossier sur votre disque dur et lancez le programme.

graphe2

Chargez ensuite l’image du graphique que vous voulez scraper (File/Load Image). Une boîte de dialogue s’ouvre, confirmez qu’il s’agit bien d’un graphe 2D et cliquez sur “Align Axes”.

graphe3

Apparaît une petite fenêtre d’explication : il faut commencer par spécifier l’axe X et l’axe Y de votre graphe en spécifiant chaque fois deux valeurs : X1 et X2 pour l’axe horizontal, Y1 et Y2 pour l’axe vertical. Cliquez sur “Proceed” pour définir les axes.

Votre curseur se transforme en pointeur, il suffit maintenant de définir les quatre repères en cliquant sur deux valeurs X, deux valeurs Y.  Un gros plan de votre sélection est visible dans la partie droite de l’écran afin de vous aider à faire votre sélection. Lorsqu’un point a été validé, il est aussi possible de le déplacer avec les touches de direction de votre clavier.

graphe4

On le voit sur l’image ci-dessus, quatre valeurs ont été définies, reste à étalonner les axes. Pour ce faire, cliquez simplement sur “Complete!” sous la fenêtre de zoom et indiquez dans la fenêtre qui vient de s’ouvrir les valeurs extrêmes de X et de Y.

graphe5

Cliquez sur OK, et votre graphe est désormais étalonné. Pour preuve, lorsque vous déplacez maintenant votre curseur sur le graphe, vous voyez les valeurs X et Y qui s’affichent sous la fenêtre de zoom.
Il faut maintenant récupérer les données qui figurent sur la ligne.

Pour ce faire, activez le mode automatique :

graphe6

Il s’agit d’un graphe relativement simple, cliquez donc sur “box” et recouvrez ainsi la ligne du graphe d’un beau rectangle jaune.

graphe7

Vous pouvez voir, dans la fenêtre de dialogue, que WPD a automatiquement reconnu les couleurs utiles : bleu pour l’avant-plan (foreground) et blanc pour l’arrière-plan (background). Il arrive que des éléments parasites l’empêchent de bien isoler le graphe de son contexte; c’est le cas ici avec le quadrillage d’arrière-plan. Changez la “Distance” entre les couleurs (j’ai mis 120), sélectionnez “Background color” et vous voyez votre graphe qui s’affiche, il a correctement été identifié par WPD.

graphe8

Cliquez ensuite sur “Filter colors” puis, un peu plus bas, sur “Run”. Vous voyez une série de points de référence s’afficher sur votre graphe (et autour de lui, malheureusement) :

graphe9

Cliquez ensuite sur “Filter colors” puis, un peu plus bas, sur “Run”. Vous voyez une série de points de référence s’afficher sur votre graphe (et autour de lui, malheureusement) :

graphe10

Lorsque c’est terminé, cliquez sur “ViewData” :

graphe11

Voici les données en csv.  Vous pouvez les exporter vers Excel, par exemple :

graphe12

Dans ce cas, il faut retravailler le graphique. Mais vous pouvez aussi importer les données dans un service de graphes interactifs : Datawrapper, Google charts ou par exemple, Plotly.

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *