Tableau Software: The Zen of Data Visualization

Publié le dans seminar-past

Séminaire du Mastère Spécialisé Big Data de Télécom ParisTech du jeudi 21 janvier 2016.

Thierry Driver, Responsable du Programme Académique et Jade Le Van, Data Analyst sont venus présenter aux étudiants du Mastère Spécialisé® Big Data les outils de Tableau Software : « Tableau Desktop » et « Tableau Public » permettant à chaque utilisateur de voir et comprendre leurs données.  

Introduction à la « Data Visualization »

70% des signaux que l’on reçoit au quotidien viennent de la vue. Les créateurs de « Tableau Software » sont partis de ce constat et ont beaucoup travaillé sur les bonnes pratiques de « visualisation de données », afin d’offrir des visuels rendant plus facile l’assimilation de l’information. Ainsi, si les moyennes chiffrées ne permettent pas d’identifier une tendance du premier coup d’œil, les présentations graphiques (courbes, graphes) rendent cela possible.

Lorsqu’il s’agit de dégager des informations instantanément, des éléments visuels entrent en jeu tels que la couleur, la taille ou l’épaisseur. Ces attributs visuels pré-attentifs sont traités par le cerveau sans nécessiter un effort de réflexion.

La visualisation de données permet également de sortir du modèle linéaire de travail sur un fichier Excel (se poser une question à laquelle on répond par un graphique) en proposant un modèle circulaire : le « Cycle of Visual Analysis », dans lequel les phases d’exploration alternent avec l’identification de tendances et de visualisations pertinentes. Plusieurs utilisateurs du jeu de données peuvent ainsi poser des questions différentes autour du même jeu de données, permettant une analyse en profondeur qui fait émerger tous les aspects du problème.

(c) Tableau

Il existe deux principaux types de données : qualitatives (qui inclut les données catégoriques et ordinales) et quantitatives. Suivant ces types de données, on accordera de l’importance à différents  aspects (dont position, couleur, taille, forme) et on privilégiera un style de présentation plutôt qu’un autre. L’orientation et les couleurs choisies influent sur la lisibilité d’une visualisation. En effet, l’intensité de la couleur permet de mettre l’accent sur ce qui est important tout en faisant attention à ne pas surcharger le graphique de couleurs car cela serait contre-productif. Il faut également tenir compte du pourcentage de personnes daltoniennes estimé à 8% de la population masculine.

Tableau desktop

« Tableau Desktop » est un outil mis gratuitement à disposition des étudiants et enseignants, permettant de se connecter à un grand nombre de données, que ce soient des fichiers statiques (Excel, CSV) ou des serveurs tels que Google Analytics ou AWS. De plus, il est possible soit de se connecter à un extrait du fichier souhaité, soit de se connecter en live au fichier. Dans ce cas, chaque modification effectuée sur Tableau sera répercutée sur le fichier choisi.

(c)Tableau

Tableau est un outil qui ne nécessite pas de connaissances en programmation puisque tout fonctionne sur un modèle « Drag and Drop ». Le logiciel reconnait automatiquement le format des données (géographiques, dates etc.) et les classe en dimensions (champs catégoriques) et mesures (champs quantitatifs), que l’on peut ensuite faire glisser sur la feuille de travail. Les données s’affichent automatiquement au format de représentation jugé le plus pertinent, mais il est possible de modifier grâce au bouton « Show Me » qui propose 24 types de visualisations. Et s’il y a des réticences à l’aspect visuel, il suffit de quelques clics pour retourner aux valeurs chiffrées type tableur.

Il est également possible de voir les données sur une carte et de créer des filtres pour se concentrer sur un ou plusieurs pays. L’intégration avec Mapbox permet, par ailleurs, de créer de superbes arrière-plans de carte et d’ajouter des couches et du contexte. Une fois que nous avons terminé nos analyses sur nos différentes feuilles de travail, nous pouvons créer un « Dashboard » (tableau de bord) afin de regrouper nos différents éléments, ce qui permet d’avoir une vue d’ensemble des données et de rendre les feuilles interactives entre elles.

Afin de publier et partager ses données, Tableau dispose de deux types de serveur, Tableau Server et Tableau Online où l’utilisateur peut publier ses feuilles et tableaux de bord. De plus, lors du partage, il est possible de gérer les permissions d’accès à certaines informations. Afin de simplement visionner les tableaux de bord, Tableau a également un autre produit, Tableau Reader, qui est un outil gratuit permettant la lecture des fichiers Tableau.

Pour ceux qui souhaitent présenter le résultat de ces analyses sur un fichier PowerPoint par exemple, Tableau permet d’exporter les visuels en plusieurs formats (dont png, jpg) ou si l’utilisateur souhaite conserver l’interactivité, Tableau inclut un mode de présentation, accessible directement à partir du « Dashboard ».

L’avantage majeur de « Tableau Desktop » est qu’il est très simple à utiliser et donc destiné à n’importe quel utilisateur qui souhaite voir et comprendre ses données. Il est très utilisé par les personnes métiers, qui ont des problématiques opérationnelles que l’analyse des données peut aider à résoudre, mais qui n’ont pas forcément les compétences techniques pour analyser ces données. Tableau leur permet de se connecter simplement à leurs données et de les analyser eux-mêmes, sans avoir à passer par une requête au département IT.  Le site internet de « Tableau Software » propose de nombreuses vidéos gratuites d’aide à la prise en main et des « Live Sessions » disponibles en plusieurs langues.

Plus d'informations sur www.tableau.com

Tableau Public

« Tableau Public » est un outil entièrement gratuit et similaire à « Tableau desktop » sauf qu’il ne permet pas la connectivité à des bases de données et que les sauvegardes s’effectuent uniquement en ligne, sur un profil personnel. Ciblant avant tout les journalistes, les bloggeurs et les chercheurs, l’idée de « Tableau Public » est de créer une communauté d’échange où les visualisations sont partageables via une URL et intégrables à des sites internet grâce à un « Embed Code ».

Cette communauté compte déjà 150 000 utilisateurs qui en font un usage très varié allant de sujets sérieux (santé, sciences) à d’autres plus ludiques (sport, musique). Mais « Tableau Public » n’est pas uniquement utilisé par les particuliers, les ONG et les organisations internationales et locales l’utilisent aussi (par exemple, dans cette visualisation sur la propagation des épidémies).

(c) tableau public

Cette communauté est très active, et l’équipe de « Tableau Public » valorise chaque jour les meilleures créations à travers le choix d’une « Viz of the Day » (visualisation du jour) mise en valeur sur le site internet de Tableau Public et sur Twitter.

Plus d'informations sur public.tableau.com