Exploiter les données issues d’une plateforme de billetterie avec Google Data Studio

Par Christian Roy

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. 

L’équipe du Carrefour international de théâtre le sait et a déployé, de façon itérative, différents outils pour exploiter ces données. Nous vous présentons ici le résultat de leur plus récente itération, réalisée avec l’accompagnement de la Communauté de pratique numérique du Conseil de la culture des régions de Québec et de Chaudière-Appalaches (CPN). Ce nouvel outil de tableau de bord s’appuie sur la solution Google Data Studio.

Point de départ

Les données d’usage du Carrefour ont historiquement été exportées depuis l’outil de billetterie (il y a eu plusieurs outils différents utilisés au cours des dernières années, pour des raisons que nous n’aborderons pas ici). Un membre de l’équipe avait développé un processus d’extraction, de stockage, de traitement et de consultation des données avec l’outil RapidMiner

La solution présentait différents problèmes :

  • à cause de la complexité technique du processus et des outils, l’équipe commerciale n’était pas suffisamment autonome pour interroger les données
    • l’interrogation des données reposait donc sur les compétences d’une seule personne (qui ne fait d’ailleurs pas partie de l’équipe commerciale) ;
  • la difficulté de croiser des données de différentes sources (à titre d’exemple, les recoupements entre les donateurs et les acheteurs de billets, ou l’impact de campagnes de promotion sur les achats à travers le système de billetterie) ;
  • les tableaux de bord disponibles n’étaient pas présentés visuellement, de façon à permettre une interprétation rapide ;
  • l’outil n’était pas disponible en ligne, et donc son utilisation limitée à certains postes de travail (moyennant des frais de licence de l’application RapidMiner).

C’est pour trouver des solutions à ces problèmes que l’équipe du Carrefour a contacté la CPN.

État des lieux

Pour appuyer la recherche de solutions, l’équipe de la CPN a d’abord dressé un état des lieux portant sur les données disponibles, les systèmes utilisés, et les besoins. Ce bilan, réalisé suite à des entrevues avec les membres de l’équipe du Carrefour, a permis de rédiger un document de définition de projet, qui couchait par écrit :

  • les enjeux et les problèmes du système actuel (évoqués précédemment)
  • les types de données (clients, spectacles, donateurs…)
  • l’inventaire des systèmes qui génèrent ou accumulent des données (billetterie, site web, fichiers Excel…)
  • les besoins qui devaient être comblés (visualiser l’évolution de certains indicateurs, générer des listes…)

C’est évidemment le dernier item, qui porte sur les besoins à combler, qui revêt le plus d’intérêt pour le développement d’une nouvelle solution.

Analyse, conception et prototypage

À partir de l’état des lieux, il a été possible de commencer à réfléchir aux solutions à mettre en place. Le conseiller de la CPN a fait des recherches, et a travaillé à définir encore plus clairement, avec l’équipe du Carrefour, le genre de visualisations recherchées. 

Pour garder les choses simples et faire des itérations rapides sur ce qu’il fallait développer, l’équipe est partie de concepts faits sur papier, en partie à main levée. Ensuite, les premiers tests avec la solution qui semblait le mieux répondre au besoin, Google Data Studio, ont été réalisés avec un petit nombre de données fictives, générées aléatoirement dans Google Sheets.

Une fois que l’équipe est arrivée à la conclusion que l’approche pouvait fonctionner (on avait une « preuve du concept »), le conseiller de la CPN a préparé une première version de l’outil s’appuyant sur les vraies données historiques du Carrefour. C’est évidemment là que ça se complique : bien que les données fussent relativement « propres », il était quand même nécessaire d’effectuer certaines opérations de « nettoyage ». À titre d’exemple, il peut s’agir de standardiser les codes postaux. Tout le « nettoyage » a pu être réalisé avec des formules dans Google Sheets. Ainsi, même lorsqu’on doit remplacer un jeu de données, aucun travail manuel n’est nécessaire pour le nettoyage : les formules prédéfinies font le travail.

Finalement, c’est l’équipe du Carrefour qui a développé les tableaux de bord finaux, avec la méthodologie suggérée par la CPN.

Le résultat

Le résultat final, pour les usagers du Carrefour, et une suite de tableaux de bord qui permettent de visualiser les données de ventes extraites de la plateforme de billetterie.

Les images suivantes montrent certains de ces tableaux de bord (certaines données ont été volontairement masquées; le tableau de bord affiche évidemment des montants ou des noms précis) :

Une page du tableau de bord permet de consulter les données de ventes, en unités, en valeur, et une répartition selon le mode de paiement, le spectacle, le lieu de vente, etc. Les outils en haut de l’écran servent à filtrer les données analysées. Par exemple, ici on analyse un seul spectacle (pour les plus observateurs, ça explique pourquoi le diagramme circulaire du centre contient une seule donnée qui représente 100 %).

 

Une autre page est dédiée à la clientèle. Encore une fois, des filtres par spectacle, codes de tarif ou lieux de vente sont disponibles. Le tableau de bord permet de visualiser le nombre de billets achetés, l’origine des acheteurs, etc.

 

La provenance des acheteurs peut être visualisée autrement, sur une carte, dans cette autre page. La carte est interactive, il est possible de faire un « zoom » pour explorer de façon plus précise les données d’une ville ou d’un quartier.

La solution s’appuie sur un processus qui implique des étapes manuelles et des étapes automatisées :

Résumé d’un processus ETL très simple. Les données sont extraites de la plateforme de billetterie au format CSV. La transformation (nettoyage et certaines manipulations) est effectuée dans Google Sheets. Enfin, les données sont chargées dans Google Data Studio.

Apprentissages et autres notes

Comme mentionné précédemment, c’est évidemment au moment d’intégrer les « vraies » données que les choses sont devenues un peu plus complexes. L’équipe du Carrefour s’y attendait parce qu’elle avait déjà tenté d’exploiter ces données, et connaissait les éléments à nettoyer. Un des apprentissages issus de ce projet est clairement de ne pas sous-estimer la difficulté associée à la (non) qualité des données.

L’autre élément notable est que Google Data Studio est un outil puissant, mais tout de même complexe. Il demande donc un certain apprentissage, et n’est pas nécessairement à la portée de tous. Une fois les tableaux de bord créés, la consultation est simple. Mais la création des tableaux de bord elle-même est relativement compliquée. À moins d’avoir la chance, comme le Carrefour international de théâtre, de disposer d’un geek ou d’une geekette en interne, il pourrait être utile de se faire accompagner pour cette étape.

Enfin, notons que ce genre de solution a l’inconvénient d’avoir une « espérance de vie » limitée. En effet, si la plateforme dont sont issues les données modifie ses formats d’exportation, la chaîne doit être revue. De plus, dès que le diffuseur change de système de billetterie, la solution doit également être adaptée… à moins de sélectionner une plateforme de billetterie qui offre des outils d’analyse de données qui rendent les tableaux de bord externes moins essentiels! C’est d’ailleurs ce que l’équipe du Carrefour a choisi de faire tout récemment.

Comment en savoir plus?

Au cours des prochaines semaines, nous publierons un autre texte portant sur les données de billetterie. Cette fois, nous explorerons la démarche du Théâtre du Trident, qui a pris une approche différente pour combler des besoins similaires à ceux du Carrefour. Assurez-vous d’être abonnés à l’infolettre de la CPN ou membres du groupe Facebook pour être informés de la publication du texte.

De plus, n’hésitez pas à prendre rendez-vous à la Clinique de la CPN si vous souhaitez discuter du sujet avec nous!

Crédits

Les icônes utilisées dans les schémas sont tirées de The Noun Project : Software de Adrien Coquet, CSV de StoneHub, spreadsheet de Erickson Duverge et dashboard de Rafael Garcia Motta.

Les tableaux de bord sont la création du Carrefour international de théâtre et sont reproduits (avec des données anonymisées) avec autorisation.

 

le babillard de la communauté

article
5 guides pour améliorer sa découvrabilité!

Nous vous suggérons 5 guides à consulter à propos de la découvrabilité et des bonnes pratiques connues à ce jour (il s’agit d’une liste de références non exhaustive!).

lire
article
Quelques références liées aux 5 concepts pour comprendre et développer des projets numériques!

Le numérique fait partie de nos vies. À défaut de tout connaître (et parce que ce n’est pas nécessaire de tout savoir), nous vous résumons à l’aide de mots clés, cinq concepts pour avancer avec confiance dans la voie numérique!

lire
article
Exploiter les données issues d’une plateforme de billetterie avec Airtable

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Le deuxième texte de la série nous a permis de voir comment le Carrefour international de théâtre exploite ces données à travers des tableaux de bord […]

lire
article
Exploiter les données issues d’une plateforme de billetterie avec Google Data Studio

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses.  L’équipe du Carrefour international de théâtre le sait et a déployé, de façon itérative, différents outils pour exploiter ces données. Nous vous présentons ici le résultat […]

lire
article
Exploiter les données issues des plateformes de billetterie : cas vécus

Les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Elles contiennent évidemment de l’information utile d’un point de vue comptable. Mais se limiter à cette utilisation serait dommage. En effet, la billetterie peut être un levier pour la transformation numérique de l’organisation. Les données d’usage (ventes, […]

lire
article
Plan d’action 2019-2022 pour la diffusion des arts de la scène : nos faits saillants!

Cet article présente les faits saillants que nous avons notés au fil de la lecture du «Rapport du comité de réflexion sur la diffusion des arts de la scène au Québec» et du plan d’action publiés par le Conseil des arts et des lettres du Québec.

lire
article
Un modèle d’énoncé de besoins pour le développement d’un site web pour la Communauté de pratique numérique

Ce document sert à la fois de guide et de listes de choses à ne pas oublier pour documenter les besoins d’une organisation qui veut développer (ou améliorer) un site web. Le document d’une douzaine de pages présente plus de vingt thèmes importants à documenter.

lire
article
Connaissez-vous les cartes enrichies du moteur de recherche Google?

Les cartes enrichies sont de plus en plus présentes dans les résultats sur le moteur de recherche Google. Il s’agit de résultats concis présentés sous forme de «cartes», avant les autres résultats de la recherche, incluant les publicités payées.

lire
article
Le Phoque OFF: aussi une occasion d’apprendre pour le milieu du spectacle!

Une belle occasion d’apprendre et d’échanger sur les enjeux actuels du milieu de la diffusion artistique.

lire
Lien externe
Projets de données: quel impact sur la transition numérique en culture ?

Article de Josée Plamondon

lire

les activités de la communauté

s'inscrire à l'infolettre de la communauté

des questions sur le projet?

418 523-1333, poste 224

communaute@culture-quebec.qc.ca


Nous remercions le Conseil des arts du Canada de son soutien.
L’an dernier, le Conseil a investi 153 millions de dollars pour mettre de l’art dans la vie des Canadiennes et des Canadiens de tout le pays.