Par Christian Roy, 26 mars 2020
Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses.
L’équipe du Carrefour international de théâtre le sait et a déployé, de façon itérative, différents outils pour exploiter ces données. Nous vous présentons ici le résultat de leur plus récente itération, réalisée avec l’accompagnement de la Communauté de pratique numérique du Conseil de la culture des régions de Québec et de Chaudière-Appalaches (CPN). Ce nouvel outil de tableau de bord s’appuie sur la solution Google Data Studio.
Les données d’usage du Carrefour ont historiquement été exportées depuis l’outil de billetterie (il y a eu plusieurs outils différents utilisés au cours des dernières années, pour des raisons que nous n’aborderons pas ici). Un membre de l’équipe avait développé un processus d’extraction, de stockage, de traitement et de consultation des données avec l’outil RapidMiner.
La solution présentait différents problèmes :
C’est pour trouver des solutions à ces problèmes que l’équipe du Carrefour a contacté la CPN.
Pour appuyer la recherche de solutions, l’équipe de la CPN a d’abord dressé un état des lieux portant sur les données disponibles, les systèmes utilisés, et les besoins. Ce bilan, réalisé suite à des entrevues avec les membres de l’équipe du Carrefour, a permis de rédiger un document de définition de projet, qui couchait par écrit :
C’est évidemment le dernier item, qui porte sur les besoins à combler, qui revêt le plus d’intérêt pour le développement d’une nouvelle solution.
À partir de l’état des lieux, il a été possible de commencer à réfléchir aux solutions à mettre en place. Le conseiller de la CPN a fait des recherches, et a travaillé à définir encore plus clairement, avec l’équipe du Carrefour, le genre de visualisations recherchées.
Pour garder les choses simples et faire des itérations rapides sur ce qu’il fallait développer, l’équipe est partie de concepts faits sur papier, en partie à main levée. Ensuite, les premiers tests avec la solution qui semblait le mieux répondre au besoin, Google Data Studio, ont été réalisés avec un petit nombre de données fictives, générées aléatoirement dans Google Sheets.
Une fois que l’équipe est arrivée à la conclusion que l’approche pouvait fonctionner (on avait une « preuve du concept »), le conseiller de la CPN a préparé une première version de l’outil s’appuyant sur les vraies données historiques du Carrefour. C’est évidemment là que ça se complique : bien que les données fussent relativement « propres », il était quand même nécessaire d’effectuer certaines opérations de « nettoyage ». À titre d’exemple, il peut s’agir de standardiser les codes postaux. Tout le « nettoyage » a pu être réalisé avec des formules dans Google Sheets. Ainsi, même lorsqu’on doit remplacer un jeu de données, aucun travail manuel n’est nécessaire pour le nettoyage : les formules prédéfinies font le travail.
Finalement, c’est l’équipe du Carrefour qui a développé les tableaux de bord finaux, avec la méthodologie suggérée par la CPN.
Le résultat final, pour les usagers du Carrefour, et une suite de tableaux de bord qui permettent de visualiser les données de ventes extraites de la plateforme de billetterie.
Les images suivantes montrent certains de ces tableaux de bord (certaines données ont été volontairement masquées; le tableau de bord affiche évidemment des montants ou des noms précis) :
Une page du tableau de bord permet de consulter les données de ventes, en unités, en valeur, et une répartition selon le mode de paiement, le spectacle, le lieu de vente, etc. Les outils en haut de l’écran servent à filtrer les données analysées. Par exemple, ici on analyse un seul spectacle (pour les plus observateurs, ça explique pourquoi le diagramme circulaire du centre contient une seule donnée qui représente 100 %).
Une autre page est dédiée à la clientèle. Encore une fois, des filtres par spectacle, codes de tarif ou lieux de vente sont disponibles. Le tableau de bord permet de visualiser le nombre de billets achetés, l’origine des acheteurs, etc.
La provenance des acheteurs peut être visualisée autrement, sur une carte, dans cette autre page. La carte est interactive, il est possible de faire un « zoom » pour explorer de façon plus précise les données d’une ville ou d’un quartier.
La solution s’appuie sur un processus qui implique des étapes manuelles et des étapes automatisées :
Résumé d’un processus ETL très simple. Les données sont extraites de la plateforme de billetterie au format CSV. La transformation (nettoyage et certaines manipulations) est effectuée dans Google Sheets. Enfin, les données sont chargées dans Google Data Studio.
Comme mentionné précédemment, c’est évidemment au moment d’intégrer les « vraies » données que les choses sont devenues un peu plus complexes. L’équipe du Carrefour s’y attendait parce qu’elle avait déjà tenté d’exploiter ces données, et connaissait les éléments à nettoyer. Un des apprentissages issus de ce projet est clairement de ne pas sous-estimer la difficulté associée à la (non) qualité des données.
L’autre élément notable est que Google Data Studio est un outil puissant, mais tout de même complexe. Il demande donc un certain apprentissage, et n’est pas nécessairement à la portée de tous. Une fois les tableaux de bord créés, la consultation est simple. Mais la création des tableaux de bord elle-même est relativement compliquée. À moins d’avoir la chance, comme le Carrefour international de théâtre, de disposer d’un geek ou d’une geekette en interne, il pourrait être utile de se faire accompagner pour cette étape.
Enfin, notons que ce genre de solution a l’inconvénient d’avoir une « espérance de vie » limitée. En effet, si la plateforme dont sont issues les données modifie ses formats d’exportation, la chaîne doit être revue. De plus, dès que le diffuseur change de système de billetterie, la solution doit également être adaptée… à moins de sélectionner une plateforme de billetterie qui offre des outils d’analyse de données qui rendent les tableaux de bord externes moins essentiels! C’est d’ailleurs ce que l’équipe du Carrefour a choisi de faire tout récemment.
Au cours des prochaines semaines, nous publierons un autre texte portant sur les données de billetterie. Cette fois, nous explorerons la démarche du Théâtre du Trident, qui a pris une approche différente pour combler des besoins similaires à ceux du Carrefour. Assurez-vous d’être abonnés à l’infolettre de la CPN ou membres du groupe Facebook pour être informés de la publication du texte.
De plus, n’hésitez pas à prendre rendez-vous à la Clinique de la CPN si vous souhaitez discuter du sujet avec nous!
Les icônes utilisées dans les schémas sont tirées de The Noun Project : Software de Adrien Coquet, CSV de StoneHub, spreadsheet de Erickson Duverge et dashboard de Rafael Garcia Motta.
Les tableaux de bord sont la création du Carrefour international de théâtre et sont reproduits (avec des données anonymisées) avec autorisation.
Vous vous demandez ce qu’est la gestion intégrée des données et pour quelles raisons vous devriez vous y intéresser? Il s’agit d’un vaste sujet qu’on tentera bien humblement de vous expliquer dans cette chronique numérique du Conseil de la culture à partir de cinq questions brèves.
lirePour les organismes culturels et les artistes, le fait d’avoir un site internet est une façon d’exister dans l’univers du web. Ce n’est pas la seule façon, direz-vous. Bien sûr que non! La liste de plateformes nous permettant d’avoir un profil, de publier de l’information, de diffuser des vidéos et des balados, de partager des photos et plus encore est quasi infinie! C’est fort utile pour la promotion et pour la visibilité. Mais est-ce suffisant?
lireLes Chroniques numériques, c’est le moyen de communication que le Conseil de la culture a retenu pour rassembler les connaissances numériques et pour favoriser l’appropriation de ses membres.
lireNous vous suggérons 5 guides à consulter à propos de la découvrabilité et des bonnes pratiques connues à ce jour (il s’agit d’une liste de références non exhaustive!).
lireLe numérique fait partie de nos vies. À défaut de tout connaître (et parce que ce n’est pas nécessaire de tout savoir), nous vous résumons à l’aide de mots clés, cinq concepts pour avancer avec confiance dans la voie numérique!
lireComme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Le deuxième texte de la série nous a permis de voir comment le Carrefour international de théâtre exploite ces données à travers des tableaux de bord […]
lireComme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. L’équipe du Carrefour international de théâtre le sait et a déployé, de façon itérative, différents outils pour exploiter ces données. Nous vous présentons ici le résultat […]
lireLes données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Elles contiennent évidemment de l’information utile d’un point de vue comptable. Mais se limiter à cette utilisation serait dommage. En effet, la billetterie peut être un levier pour la transformation numérique de l’organisation. Les données d’usage (ventes, […]
lireCet article présente les faits saillants que nous avons notés au fil de la lecture du «Rapport du comité de réflexion sur la diffusion des arts de la scène au Québec» et du plan d’action publiés par le Conseil des arts et des lettres du Québec.
lireCe document sert à la fois de guide et de listes de choses à ne pas oublier pour documenter les besoins d’une organisation qui veut développer (ou améliorer) un site web. Le document d’une douzaine de pages présente plus de vingt thèmes importants à documenter.
lire