Exploiter les données issues d’une plateforme de billetterie avec Google Data Studio

Par Christian Roy

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. 

L’équipe du Carrefour international de théâtre le sait et a déployé, de façon itérative, différents outils pour exploiter ces données. Nous vous présentons ici le résultat de leur plus récente itération, réalisée avec l’accompagnement de la Communauté de pratique numérique du Conseil de la culture des régions de Québec et de Chaudière-Appalaches (CPN). Ce nouvel outil de tableau de bord s’appuie sur la solution Google Data Studio.

Point de départ

Les données d’usage du Carrefour ont historiquement été exportées depuis l’outil de billetterie (il y a eu plusieurs outils différents utilisés au cours des dernières années, pour des raisons que nous n’aborderons pas ici). Un membre de l’équipe avait développé un processus d’extraction, de stockage, de traitement et de consultation des données avec l’outil RapidMiner

La solution présentait différents problèmes :

  • à cause de la complexité technique du processus et des outils, l’équipe commerciale n’était pas suffisamment autonome pour interroger les données
    • l’interrogation des données reposait donc sur les compétences d’une seule personne (qui ne fait d’ailleurs pas partie de l’équipe commerciale) ;
  • la difficulté de croiser des données de différentes sources (à titre d’exemple, les recoupements entre les donateurs et les acheteurs de billets, ou l’impact de campagnes de promotion sur les achats à travers le système de billetterie) ;
  • les tableaux de bord disponibles n’étaient pas présentés visuellement, de façon à permettre une interprétation rapide ;
  • l’outil n’était pas disponible en ligne, et donc son utilisation limitée à certains postes de travail (moyennant des frais de licence de l’application RapidMiner).

C’est pour trouver des solutions à ces problèmes que l’équipe du Carrefour a contacté la CPN.

État des lieux

Pour appuyer la recherche de solutions, l’équipe de la CPN a d’abord dressé un état des lieux portant sur les données disponibles, les systèmes utilisés, et les besoins. Ce bilan, réalisé suite à des entrevues avec les membres de l’équipe du Carrefour, a permis de rédiger un document de définition de projet, qui couchait par écrit :

  • les enjeux et les problèmes du système actuel (évoqués précédemment)
  • les types de données (clients, spectacles, donateurs…)
  • l’inventaire des systèmes qui génèrent ou accumulent des données (billetterie, site web, fichiers Excel…)
  • les besoins qui devaient être comblés (visualiser l’évolution de certains indicateurs, générer des listes…)

C’est évidemment le dernier item, qui porte sur les besoins à combler, qui revêt le plus d’intérêt pour le développement d’une nouvelle solution.

Analyse, conception et prototypage

À partir de l’état des lieux, il a été possible de commencer à réfléchir aux solutions à mettre en place. Le conseiller de la CPN a fait des recherches, et a travaillé à définir encore plus clairement, avec l’équipe du Carrefour, le genre de visualisations recherchées. 

Pour garder les choses simples et faire des itérations rapides sur ce qu’il fallait développer, l’équipe est partie de concepts faits sur papier, en partie à main levée. Ensuite, les premiers tests avec la solution qui semblait le mieux répondre au besoin, Google Data Studio, ont été réalisés avec un petit nombre de données fictives, générées aléatoirement dans Google Sheets.

Une fois que l’équipe est arrivée à la conclusion que l’approche pouvait fonctionner (on avait une « preuve du concept »), le conseiller de la CPN a préparé une première version de l’outil s’appuyant sur les vraies données historiques du Carrefour. C’est évidemment là que ça se complique : bien que les données fussent relativement « propres », il était quand même nécessaire d’effectuer certaines opérations de « nettoyage ». À titre d’exemple, il peut s’agir de standardiser les codes postaux. Tout le « nettoyage » a pu être réalisé avec des formules dans Google Sheets. Ainsi, même lorsqu’on doit remplacer un jeu de données, aucun travail manuel n’est nécessaire pour le nettoyage : les formules prédéfinies font le travail.

Finalement, c’est l’équipe du Carrefour qui a développé les tableaux de bord finaux, avec la méthodologie suggérée par la CPN.

Le résultat

Le résultat final, pour les usagers du Carrefour, et une suite de tableaux de bord qui permettent de visualiser les données de ventes extraites de la plateforme de billetterie.

Les images suivantes montrent certains de ces tableaux de bord (certaines données ont été volontairement masquées; le tableau de bord affiche évidemment des montants ou des noms précis) :

Une page du tableau de bord permet de consulter les données de ventes, en unités, en valeur, et une répartition selon le mode de paiement, le spectacle, le lieu de vente, etc. Les outils en haut de l’écran servent à filtrer les données analysées. Par exemple, ici on analyse un seul spectacle (pour les plus observateurs, ça explique pourquoi le diagramme circulaire du centre contient une seule donnée qui représente 100 %).

 

Une autre page est dédiée à la clientèle. Encore une fois, des filtres par spectacle, codes de tarif ou lieux de vente sont disponibles. Le tableau de bord permet de visualiser le nombre de billets achetés, l’origine des acheteurs, etc.

 

La provenance des acheteurs peut être visualisée autrement, sur une carte, dans cette autre page. La carte est interactive, il est possible de faire un « zoom » pour explorer de façon plus précise les données d’une ville ou d’un quartier.

La solution s’appuie sur un processus qui implique des étapes manuelles et des étapes automatisées :

Résumé d’un processus ETL très simple. Les données sont extraites de la plateforme de billetterie au format CSV. La transformation (nettoyage et certaines manipulations) est effectuée dans Google Sheets. Enfin, les données sont chargées dans Google Data Studio.

Apprentissages et autres notes

Comme mentionné précédemment, c’est évidemment au moment d’intégrer les « vraies » données que les choses sont devenues un peu plus complexes. L’équipe du Carrefour s’y attendait parce qu’elle avait déjà tenté d’exploiter ces données, et connaissait les éléments à nettoyer. Un des apprentissages issus de ce projet est clairement de ne pas sous-estimer la difficulté associée à la (non) qualité des données.

L’autre élément notable est que Google Data Studio est un outil puissant, mais tout de même complexe. Il demande donc un certain apprentissage, et n’est pas nécessairement à la portée de tous. Une fois les tableaux de bord créés, la consultation est simple. Mais la création des tableaux de bord elle-même est relativement compliquée. À moins d’avoir la chance, comme le Carrefour international de théâtre, de disposer d’un geek ou d’une geekette en interne, il pourrait être utile de se faire accompagner pour cette étape.

Enfin, notons que ce genre de solution a l’inconvénient d’avoir une « espérance de vie » limitée. En effet, si la plateforme dont sont issues les données modifie ses formats d’exportation, la chaîne doit être revue. De plus, dès que le diffuseur change de système de billetterie, la solution doit également être adaptée… à moins de sélectionner une plateforme de billetterie qui offre des outils d’analyse de données qui rendent les tableaux de bord externes moins essentiels! C’est d’ailleurs ce que l’équipe du Carrefour a choisi de faire tout récemment.

Comment en savoir plus?

Au cours des prochaines semaines, nous publierons un autre texte portant sur les données de billetterie. Cette fois, nous explorerons la démarche du Théâtre du Trident, qui a pris une approche différente pour combler des besoins similaires à ceux du Carrefour. Assurez-vous d’être abonnés à l’infolettre de la CPN ou membres du groupe Facebook pour être informés de la publication du texte.

De plus, n’hésitez pas à prendre rendez-vous à la Clinique de la CPN si vous souhaitez discuter du sujet avec nous!

Crédits

Les icônes utilisées dans les schémas sont tirées de The Noun Project : Software de Adrien Coquet, CSV de StoneHub, spreadsheet de Erickson Duverge et dashboard de Rafael Garcia Motta.

Les tableaux de bord sont la création du Carrefour international de théâtre et sont reproduits (avec des données anonymisées) avec autorisation.

 

le babillard de la communauté

article et capsule vidéo
Chronique numérique 2 : Comprendre la gestion intégrée des données… en 5 questions?

Vous vous demandez ce qu’est la gestion intégrée des données et pour quelles raisons vous devriez vous y intéresser? Il s’agit d’un vaste sujet qu’on tentera bien humblement de vous expliquer dans cette chronique numérique du Conseil de la culture à partir de cinq questions brèves.

lire
article
Chronique numérique 1 : Ai-je encore besoin d’avoir un site web en 2021?

Pour les organismes culturels et les artistes, le fait d’avoir un site internet est une façon d’exister dans l’univers du web. Ce n’est pas la seule façon, direz-vous. Bien sûr que non! La liste de plateformes nous permettant d’avoir un profil, de publier de l’information, de diffuser des vidéos et des balados, de partager des photos et plus encore est quasi infinie! C’est fort utile pour la promotion et pour la visibilité. Mais est-ce suffisant?

lire
article
Les Chroniques numériques du Conseil de la culture!

Les Chroniques numériques, c’est le moyen de communication que le Conseil de la culture a retenu pour rassembler les connaissances numériques et pour favoriser l’appropriation de ses membres.

lire
article
5 guides pour améliorer sa découvrabilité!

Nous vous suggérons 5 guides à consulter à propos de la découvrabilité et des bonnes pratiques connues à ce jour (il s’agit d’une liste de références non exhaustive!).

lire
article
Quelques références liées aux 5 concepts pour comprendre et développer des projets numériques!

Le numérique fait partie de nos vies. À défaut de tout connaître (et parce que ce n’est pas nécessaire de tout savoir), nous vous résumons à l’aide de mots clés, cinq concepts pour avancer avec confiance dans la voie numérique!

lire
article
Exploiter les données issues d’une plateforme de billetterie avec Airtable

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Le deuxième texte de la série nous a permis de voir comment le Carrefour international de théâtre exploite ces données à travers des tableaux de bord […]

lire
article
Exploiter les données issues d’une plateforme de billetterie avec Google Data Studio

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses.  L’équipe du Carrefour international de théâtre le sait et a déployé, de façon itérative, différents outils pour exploiter ces données. Nous vous présentons ici le résultat […]

lire
article
Exploiter les données issues des plateformes de billetterie : cas vécus

Les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Elles contiennent évidemment de l’information utile d’un point de vue comptable. Mais se limiter à cette utilisation serait dommage. En effet, la billetterie peut être un levier pour la transformation numérique de l’organisation. Les données d’usage (ventes, […]

lire
article
Plan d’action 2019-2022 pour la diffusion des arts de la scène : nos faits saillants!

Cet article présente les faits saillants que nous avons notés au fil de la lecture du «Rapport du comité de réflexion sur la diffusion des arts de la scène au Québec» et du plan d’action publiés par le Conseil des arts et des lettres du Québec.

lire
article
Un modèle d’énoncé de besoins pour le développement d’un site web pour la Communauté de pratique numérique

Ce document sert à la fois de guide et de listes de choses à ne pas oublier pour documenter les besoins d’une organisation qui veut développer (ou améliorer) un site web. Le document d’une douzaine de pages présente plus de vingt thèmes importants à documenter.

lire

les activités de la communauté


Nous remercions le Conseil des arts du Canada de son soutien.
2021 © Communauté de pratique numérique