Vous voyez un graphe (interactif ou non, ça peut être simplement une image) et vous voulez en récupérer les données. Pour les importer dans un tableur et faire une version interactive de ce graphe, par exemple. Un miracle que permet, notamment, WebPlotDigitizer. Il permet aussi de mesurer, sur une photo, longueurs et distances.
Voici le graphe, issu d’un rapport pdf de l’IRM, illustrant l’évolution sur 50 ans de la vitesse moyenne des vents en Belgique.
our faire l’exercice, importez n’importe quel graphe sur internet ou enregistrez celui ci-dessus (bouton droit, enregistrer sous).
Téléchargez WebPlotDigitizer, décompressez le dossier sur votre disque dur et lancez le programme.
Chargez ensuite l’image du graphique que vous voulez scraper (File/Load Image). Une boîte de dialogue s’ouvre, confirmez qu’il s’agit bien d’un graphe 2D et cliquez sur “Align Axes”.
Apparaît une petite fenêtre d’explication : il faut commencer par spécifier l’axe X et l’axe Y de votre graphe en spécifiant chaque fois deux valeurs : X1 et X2 pour l’axe horizontal, Y1 et Y2 pour l’axe vertical. Cliquez sur “Proceed” pour définir les axes.
Votre curseur se transforme en pointeur, il suffit maintenant de définir les quatre repères en cliquant sur deux valeurs X, deux valeurs Y. Un gros plan de votre sélection est visible dans la partie droite de l’écran afin de vous aider à faire votre sélection. Lorsqu’un point a été validé, il est aussi possible de le déplacer avec les touches de direction de votre clavier.
On le voit sur l’image ci-dessus, quatre valeurs ont été définies, reste à étalonner les axes. Pour ce faire, cliquez simplement sur “Complete!” sous la fenêtre de zoom et indiquez dans la fenêtre qui vient de s’ouvrir les valeurs extrêmes de X et de Y.
Cliquez sur OK, et votre graphe est désormais étalonné. Pour preuve, lorsque vous déplacez maintenant votre curseur sur le graphe, vous voyez les valeurs X et Y qui s’affichent sous la fenêtre de zoom.
Il faut maintenant récupérer les données qui figurent sur la ligne.
Pour ce faire, activez le mode automatique :
Il s’agit d’un graphe relativement simple, cliquez donc sur “box” et recouvrez ainsi la ligne du graphe d’un beau rectangle jaune.
Vous pouvez voir, dans la fenêtre de dialogue, que WPD a automatiquement reconnu les couleurs utiles : bleu pour l’avant-plan (foreground) et blanc pour l’arrière-plan (background). Il arrive que des éléments parasites l’empêchent de bien isoler le graphe de son contexte; c’est le cas ici avec le quadrillage d’arrière-plan. Changez la “Distance” entre les couleurs (j’ai mis 120), sélectionnez “Background color” et vous voyez votre graphe qui s’affiche, il a correctement été identifié par WPD.
Cliquez ensuite sur “Filter colors” puis, un peu plus bas, sur “Run”. Vous voyez une série de points de référence s’afficher sur votre graphe (et autour de lui, malheureusement) :
Cliquez ensuite sur “Filter colors” puis, un peu plus bas, sur “Run”. Vous voyez une série de points de référence s’afficher sur votre graphe (et autour de lui, malheureusement) :
Lorsque c’est terminé, cliquez sur “ViewData” :
Voici les données en csv. Vous pouvez les exporter vers Excel, par exemple :