Exploiter les données issues d’une plateforme de billetterie avec Airtable

Par Christian Roy

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Le deuxième texte de la série nous a permis de voir comment le Carrefour international de théâtre exploite ces données à travers des tableaux de bord réalisés avec la solution Google Data Studio.

Ce troisième et dernier (pour l’instant!) texte de la série s’attarde à l’approche retenue par Le théâtre du Trident, qui a choisi d’utiliser la plateforme Airtable pour exploiter ses données de ventes. L’équipe du Trident a été accompagnée par un conseiller de la Communauté de pratique numérique du Conseil de la culture des régions de Québec et de Chaudière-Appalaches (CPN) pour développer la preuve de concept de la solution.

Point de départ

Les données concernant les ventes et la clientèle du Trident sont stockées dans sa plateforme de billetterie.

Le Trident souhaitait se doter de moyens…

  • d’enrichir les données concernant la clientèle, par exemple par l’ajout d’étiquettes (« tags ») permettant d’identifier des clients fidèles, des donateurs, etc.
  • de générer des listes de clients en fonction de différents critères (les étiquettes, clients abonnés, acheteurs de tel ou tel spectacle, etc.)
  • d’identifier ses clients et ses abonnés fidèles
  • de conserver une copie des précieuses informations relatives à ses ventes et à ses clients dans une plateforme indépendante de la plateforme de billetterie, et qui soit pérenne même en cas de changement de solution de billetterie.

Des premières recherches réalisées en interne avaient permis à l’équipe d’identifier Airtable comme solution possible. L’équipe avait fait des tests préliminaires d’Airtable sur un petit jeu de données.

Analyse, conception et prototypage

Avant de démarrer les travaux, une phase d’analyse plus détaillée a été réalisée par l’équipe du Trident et le conseiller de la CPN. Ces travaux ont permis d’identifier certains défis qui devraient être relevés dans la mise en place d’une solution.

Le premier défi est l’absence de mécanismes qui permettent d’extraire les données de façon automatisée de la plateforme de billetterie (par exemple, une API). Cela fait en sorte qu’il est impossible de synchroniser les données de façon automatique et en temps réel depuis la billetterie vers un autre système. Il faut donc imaginer un processus qui implique forcément une intervention humaine, mais qui la simplifie au maximum (pour gagner du temps, mais également pour réduire les risques d’erreurs).

Le second défi est associé aux données elles-mêmes, qui ne sont pas parfaites. L’exemple classique est celui des adresses, qui ne sont pas toujours saisies de la même façon (pour toutes sortes de bonnes ou de moins bonnes raisons). On se retrouve avec des coordonnées qui peuvent parfois être utilisées telles qu’elles, alors que d’autres doivent être corrigées (pour isoler le code postal de l’adresse civique, par exemple). La difficulté du projet est de faire en sorte qu’on puisse corriger les données dans la nouvelle plateforme, sans « perdre » les corrections lors de futures synchronisations (en sachant qu’évidemment, la solution idéale serait de corriger les données à la source).

Enfin, le troisième grand défi relève du volume de données. Le nombre d’enregistrements généré par les données concernant les clients et leurs achats de billets et d’abonnement dépasse la capacité du plus grand forfait Airtable!

Les travaux du conseiller le CPN, en appui à l’équipe du Trident, ont permis d’arriver à une base de données Airtable, couplée à une procédure de synchronisation de données depuis la plateforme de billetterie. Cette base répond aux besoins qui avaient été identifiés, et la procédure de synchronisation apporte des solutions aux défis décrits ci-dessus, et à plusieurs autres enjeux techniques (si vous avez déjà fait circuler des fichiers CSV depuis applications patrimoniales qui ont été bâties pour être compatibles avec Excel 97, vers des applications modernes qui respectent vraiment le standard CSV, vous avez une idée de ce dont on parle…)

Le résultat

Après l’intervention de la CPN, le résultat est une base de données Airtable qui contient l’ensemble des clients du Trident, et de leurs achats.

Cela permet de générer des listes et des statistiques de façon très simple, avec les outils d’Airtable.

Statistiques sur les acheteurs de billets. Un champ calculé détermine le nombre de billets achetés par un client. La fonction de gestion des champs dans une « vue » permet de limiter l’affichage aux colonnes pertinentes. La fonction de filtre permet de se concentrer sur certains enregistrements. Enfin, la fonction de tri permet de présenter les données en ordre décroissant de nombre de billets.

 

Une autre vue est optimisée pour générer des listes d’adresses courriel. L’outil de tri permet de sélectionner les clients à inclure dans la liste. Ici, on souhaite rejoindre tous les clients qui ont acheté plus de deux billets, et dont on a l’adresse courriel. La liste peut être « copiée-collée » ailleurs, ou exportée au format CSV.

Le résultat des travaux de la communauté de pratique inclut également un document de référence qui explique l’architecture des données, et la procédure de nettoyage et de synchronisation. La solution s’appuie sur un processus qui implique des étapes manuelles et des étapes automatisées :

Il s’agit d’un processus ETL très simple. Les données sont extraites de la plateforme de billetterie au format CSV. La conversion (simple correction à l’encodage) est effectuée dans Google Sheets. Enfin, les données sont chargées dans Airtable grâce au bloc d’import CSV, où des formules font la majorité des corrections et standardisation.

 

Apprentissages et autres notes

Évidemment, la démarche a permis de faire des apprentissages et des constats qu’il pourrait être utile de partager.

L’enjeu de la qualité des données, et ses impacts, sont évidemment incontournables. Dans le cadre du présent projet, notons que les données exportées de la plateforme de billetterie s’appuyaient sur des identifiants uniques de clients, utilisés à la fois pour les données de clientèle et des ventes. Cet identifiant agissant comme clé de jointure, il a été possible de reconstituer en bonne partie une structure de données cohérente.

Un autre apprentissage réside dans la façon d’utiliser le bloc d’importation CSV d’Airtable. Plus spécifiquement, la bonne utilisation de son option d’ajout en absolu ou de façon incrémentale a été essentielle (pour des données de clients, on veut ajouter seulement les nouveaux, et mettre à jour ceux qui étaient déjà présents dans la base; pour les données de ventes, on veut toujours tout compiler).

Enfin, le défi du volume de données est toujours d’actualité. L’équipe du Trident est en contact avec Airtable pour savoir s’il est possible d’obtenir des forfaits permettant de traiter un plus grand volume.

Comment en savoir plus?

Si vous voulez en savoir plus sur la solution Airtable, nous vous invitons à visionner l’enregistrement de la conférence en ligne offerte par la CPN sur le sujet.

De plus, nous publierons des suites aux articles de la présente série si de nouvelles informations s’ajoutent. Assurez-vous d’être abonnés à l’infolettre de la CPN ou membre du groupe Facebook pour être recevoir l’information.

De plus, n’hésitez pas à prendre rendez-vous à la Clinique de la CPN si vous souhaitez discuter du sujet avec nous!

Crédits

Les icônes utilisées dans les schémas sont tirées de The Noun Project : Software de Adrien Coquet, CSV de StoneHub, spreadsheet de Erickson Duverge et database de Vectors Point.

Les saisies d’écran illustrent la base Airtable du Théâtre du Trident et sont reproduites (avec des données anonymisées) avec autorisation.

 

le babillard de la communauté

article
5 guides pour améliorer sa découvrabilité!

Nous vous suggérons 5 guides à consulter à propos de la découvrabilité et des bonnes pratiques connues à ce jour (il s’agit d’une liste de références non exhaustive!).

lire
article
Quelques références liées aux 5 concepts pour comprendre et développer des projets numériques!

Le numérique fait partie de nos vies. À défaut de tout connaître (et parce que ce n’est pas nécessaire de tout savoir), nous vous résumons à l’aide de mots clés, cinq concepts pour avancer avec confiance dans la voie numérique!

lire
article
Exploiter les données issues d’une plateforme de billetterie avec Airtable

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Le deuxième texte de la série nous a permis de voir comment le Carrefour international de théâtre exploite ces données à travers des tableaux de bord […]

lire
article
Exploiter les données issues d’une plateforme de billetterie avec Google Data Studio

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses.  L’équipe du Carrefour international de théâtre le sait et a déployé, de façon itérative, différents outils pour exploiter ces données. Nous vous présentons ici le résultat […]

lire
article
Exploiter les données issues des plateformes de billetterie : cas vécus

Les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Elles contiennent évidemment de l’information utile d’un point de vue comptable. Mais se limiter à cette utilisation serait dommage. En effet, la billetterie peut être un levier pour la transformation numérique de l’organisation. Les données d’usage (ventes, […]

lire
article
Plan d’action 2019-2022 pour la diffusion des arts de la scène : nos faits saillants!

Cet article présente les faits saillants que nous avons notés au fil de la lecture du «Rapport du comité de réflexion sur la diffusion des arts de la scène au Québec» et du plan d’action publiés par le Conseil des arts et des lettres du Québec.

lire
article
Un modèle d’énoncé de besoins pour le développement d’un site web pour la Communauté de pratique numérique

Ce document sert à la fois de guide et de listes de choses à ne pas oublier pour documenter les besoins d’une organisation qui veut développer (ou améliorer) un site web. Le document d’une douzaine de pages présente plus de vingt thèmes importants à documenter.

lire
article
Connaissez-vous les cartes enrichies du moteur de recherche Google?

Les cartes enrichies sont de plus en plus présentes dans les résultats sur le moteur de recherche Google. Il s’agit de résultats concis présentés sous forme de «cartes», avant les autres résultats de la recherche, incluant les publicités payées.

lire
article
Le Phoque OFF: aussi une occasion d’apprendre pour le milieu du spectacle!

Une belle occasion d’apprendre et d’échanger sur les enjeux actuels du milieu de la diffusion artistique.

lire
Lien externe
Projets de données: quel impact sur la transition numérique en culture ?

Article de Josée Plamondon

lire

les activités de la communauté

s'inscrire à l'infolettre de la communauté

des questions sur le projet?

418 523-1333, poste 224

communaute@culture-quebec.qc.ca


Nous remercions le Conseil des arts du Canada de son soutien.
L’an dernier, le Conseil a investi 153 millions de dollars pour mettre de l’art dans la vie des Canadiennes et des Canadiens de tout le pays.