Souvenez-vous du précédent article où il était question des normes et de leur utilisation raisonnable et mesurée par l’Empereur. Pas de normes à tout va donc… faut-il encore aussi, quand on y a recours, savoir en faire un bon usage. La datavisualisation est un parfait exemple d’un domaine où les normes sont particulièrement bienvenues. Pour faire de la datavisualisation, il existe en effet un vocabulaire visuel, communément admis… c’est-à-dire des normes : on préconise certaines représentations pour mettre en image certaines données. Rappelons que la datavisualisation est une discipline qui rassemble un ensemble de méthodes permettant de résumer de manière graphique de grandes quantités de données ; c’est une modélisation graphique et visuelle de vos données permettant leur meilleure compréhension et connaissance. Pour de la datavisualisation qualitative, besoin de normes certes, mais aussi de rigueur et de méthodologie. Comment rendre lisibles et visuelles ses données ? Retour (encore) vers le XIXe siècle.
Sur les traces du précurseur de la datavisualisation
Avec sa Carte figurative des pertes successives en hommes de l’armée française dans la campagne de Russie 1812-1813, réalisée en 1869, Charles Minard, ingénieur, fait figure de « super star » de la visualisation de l’information. Comme toute datavisualisation, l’outil graphique de Minard, qui analyse un échec impérial cuisant, arrive un peu tard. On peut légitimement s’interroger sur le but recherché par l’ingénieur quand il élabora la carte.
Souhaitait-il montrer l’horreur de cette campagne guerrière ?
Voulait-il démontrer l’effet de causalité entre la température extérieure et les pertes humaines ?
Envisageait-il de proposer aux stratèges un outil leur permettant de mieux préparer une prochaine guerre ?
Chacun peut analyser les courbes selon un prisme différent et la lecture et la compréhension de la carte en sont considérablement changées. Si l’usage de cette carte reste donc problématique, sa qualité visuelle et graphique, elle, fait l’unanimité et reste un exemple pour tous les spécialistes en datavisualisation.
Petit traité de datavisualisation, selon Charles Minard
Pour élaborer sa cinquantaine de cartes au total, Charles Minard mit en œuvre de manière très efficace plusieurs bonnes pratiques :
Croiser des indicateurs : quasi une évidence… Un seul facteur ou une seule famille de facteurs ne sert pas à grand-chose pour l’analyse.
Donner d’emblée du contexte en choisissant la représentation graphique adaptée (ici la carte pour Minard).
Combiner les axes d’analyse (temporels, géographiques, météorologiques…)
Comparer des valeurs (l’avancée versus la retraite, en utilisant la même représentation graphique, mais en changeant la couleur)
Utiliser le diagramme de Sankey (ingénieur anglais qui l’a inventé) peut être d’une grande aide : il s’agit de faire varier la taille des segments proportionnellement à l’évolution des quantités.
Définir certains concepts
Adapter la taille des caractères afin de ne pas empiéter sur les informations sur lesquelles on veut que le lecteur pose son regard
Lier graphiquement les informations dont on veut montrer la causalité
Ajouter du contexte sous forme de texte introductif
Donner ces sources (pour Minard, 5 sources différentes, entre journaux personnels et ouvrages historiques)
En suivant ces quelques conseils, vous serez sur la voie d’une datavisualisation de vos données évocatrice, futur outil d’analyse et de compréhension pour vos collaborateurs et interlocuteurs. En général, une visualisation graphique et cartographique (réussie évidemment) produit un effet « whaou », ce qui a fait dire, un jour, à l’un de mes clients : « tout est géographique ».
Napoléon ne me contredirait pas… n’abusez pas des cartes. Cependant, pour chaque nouveau projet de datavisualisation, posez-vous toujours la question de la carte et de son utilité dans ce cas précis. Sachez écouter le Charles Minard qui sommeille en vous…
— For my english speaking friends
Remember the previous article on standards and the Emperor’s reasonable and measured use of them? So, standards aren’t just for show… when they are used, it’s also important to know how to make good use of them. Datavisualization is a perfect example of an area where standards are particularly welcome. For datavisualization, there is a commonly accepted visual vocabulary… in other words, standards: certain representations are recommended to put certain data into images. As a reminder, datavisualization is a discipline that brings together a set of methods for graphically summarizing large quantities of data; it’s a graphical and visual modeling of your data, enabling it to be better understood and understood. Qualitative datavisualization requires standards, but also rigor and methodology. How do you make your data legible and visual? Back (again) to the 19th century.
In the footsteps of the forerunner of datavisualization
With his Carte figurative des pertes successives en hommes de l’armée française dans la campagne de Russie 1812-1813, produced in 1869, Charles Minard, an engineer, became a « super star » of information visualization. Like all datavisualization, Minard’s graphic tool, which analyzes a bitter imperial failure, comes a little late. We can legitimately wonder what the engineer was aiming for when he drew up the map.
– Did he want to show the horror of this warlike campaign?
– Did he want to demonstrate the causal effect between outside temperature and loss of life?
– Did he intend to offer strategists a tool to better prepare for the next war?
Everyone can analyze the curves through a different prism, and the reading and understanding of the map are considerably altered. While the use of this map remains problematic, its visual and graphic quality is unanimously appreciated, and remains an example for all datavisualization specialists.
A short treatise on datavisualisation, by Charles Minard
Charles Minard used a number of best practices to create his fifty or so maps:
– A single factor or family of factors is of little use for analysis.
– Provide context from the outset by choosing the right graphic representation (here, a map for Minard).
– Combine analysis axes (temporal, geographical, meteorological, etc.).
– Compare values (advancement versus retirement, using the same graphical representation, but changing the color).
– Using the Sankey diagram (invented by an English engineer) can be a great help: vary the size of the segments in proportion to the evolution of the quantities.
– Defining certain concepts
– Adapt font size so as not to encroach on the information you want the reader to focus on
– Graphically link information to show causality
– Add context in the form of introductory text
– Give sources (for Minard, 5 different sources, between personal diaries and historical works).
By following these few tips, you’ll be on your way to an evocative datavisualization of your data, a future tool for analysis and understanding for your collaborators and interlocutors. In general, a (successful) graphic and cartographic visualization produces a « wow » effect, as one of my customers once said: « everything is geographical ».
Napoleon wouldn’t contradict me… don’t overuse maps. However, for each new data visualization project, always ask yourself the question of the map and its usefulness in this specific case. Listen to your inner Charles Minard…