Par Christian Roy, 6 avril 2020
Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Le deuxième texte de la série nous a permis de voir comment le Carrefour international de théâtre exploite ces données à travers des tableaux de bord réalisés avec la solution Google Data Studio.
Ce troisième et dernier (pour l’instant!) texte de la série s’attarde à l’approche retenue par Le théâtre du Trident, qui a choisi d’utiliser la plateforme Airtable pour exploiter ses données de ventes. L’équipe du Trident a été accompagnée par un conseiller de la Communauté de pratique numérique du Conseil de la culture des régions de Québec et de Chaudière-Appalaches (CPN) pour développer la preuve de concept de la solution.
Les données concernant les ventes et la clientèle du Trident sont stockées dans sa plateforme de billetterie.
Le Trident souhaitait se doter de moyens…
Des premières recherches réalisées en interne avaient permis à l’équipe d’identifier Airtable comme solution possible. L’équipe avait fait des tests préliminaires d’Airtable sur un petit jeu de données.
Avant de démarrer les travaux, une phase d’analyse plus détaillée a été réalisée par l’équipe du Trident et le conseiller de la CPN. Ces travaux ont permis d’identifier certains défis qui devraient être relevés dans la mise en place d’une solution.
Le premier défi est l’absence de mécanismes qui permettent d’extraire les données de façon automatisée de la plateforme de billetterie (par exemple, une API). Cela fait en sorte qu’il est impossible de synchroniser les données de façon automatique et en temps réel depuis la billetterie vers un autre système. Il faut donc imaginer un processus qui implique forcément une intervention humaine, mais qui la simplifie au maximum (pour gagner du temps, mais également pour réduire les risques d’erreurs).
Le second défi est associé aux données elles-mêmes, qui ne sont pas parfaites. L’exemple classique est celui des adresses, qui ne sont pas toujours saisies de la même façon (pour toutes sortes de bonnes ou de moins bonnes raisons). On se retrouve avec des coordonnées qui peuvent parfois être utilisées telles qu’elles, alors que d’autres doivent être corrigées (pour isoler le code postal de l’adresse civique, par exemple). La difficulté du projet est de faire en sorte qu’on puisse corriger les données dans la nouvelle plateforme, sans « perdre » les corrections lors de futures synchronisations (en sachant qu’évidemment, la solution idéale serait de corriger les données à la source).
Enfin, le troisième grand défi relève du volume de données. Le nombre d’enregistrements généré par les données concernant les clients et leurs achats de billets et d’abonnement dépasse la capacité du plus grand forfait Airtable!
Les travaux du conseiller le CPN, en appui à l’équipe du Trident, ont permis d’arriver à une base de données Airtable, couplée à une procédure de synchronisation de données depuis la plateforme de billetterie. Cette base répond aux besoins qui avaient été identifiés, et la procédure de synchronisation apporte des solutions aux défis décrits ci-dessus, et à plusieurs autres enjeux techniques (si vous avez déjà fait circuler des fichiers CSV depuis applications patrimoniales qui ont été bâties pour être compatibles avec Excel 97, vers des applications modernes qui respectent vraiment le standard CSV, vous avez une idée de ce dont on parle…)
Après l’intervention de la CPN, le résultat est une base de données Airtable qui contient l’ensemble des clients du Trident, et de leurs achats.
Cela permet de générer des listes et des statistiques de façon très simple, avec les outils d’Airtable.
Statistiques sur les acheteurs de billets. Un champ calculé détermine le nombre de billets achetés par un client. La fonction de gestion des champs dans une « vue » permet de limiter l’affichage aux colonnes pertinentes. La fonction de filtre permet de se concentrer sur certains enregistrements. Enfin, la fonction de tri permet de présenter les données en ordre décroissant de nombre de billets.
Une autre vue est optimisée pour générer des listes d’adresses courriel. L’outil de tri permet de sélectionner les clients à inclure dans la liste. Ici, on souhaite rejoindre tous les clients qui ont acheté plus de deux billets, et dont on a l’adresse courriel. La liste peut être « copiée-collée » ailleurs, ou exportée au format CSV.
Le résultat des travaux de la communauté de pratique inclut également un document de référence qui explique l’architecture des données, et la procédure de nettoyage et de synchronisation. La solution s’appuie sur un processus qui implique des étapes manuelles et des étapes automatisées :
Il s’agit d’un processus ETL très simple. Les données sont extraites de la plateforme de billetterie au format CSV. La conversion (simple correction à l’encodage) est effectuée dans Google Sheets. Enfin, les données sont chargées dans Airtable grâce au bloc d’import CSV, où des formules font la majorité des corrections et standardisation.
Évidemment, la démarche a permis de faire des apprentissages et des constats qu’il pourrait être utile de partager.
L’enjeu de la qualité des données, et ses impacts, sont évidemment incontournables. Dans le cadre du présent projet, notons que les données exportées de la plateforme de billetterie s’appuyaient sur des identifiants uniques de clients, utilisés à la fois pour les données de clientèle et des ventes. Cet identifiant agissant comme clé de jointure, il a été possible de reconstituer en bonne partie une structure de données cohérente.
Un autre apprentissage réside dans la façon d’utiliser le bloc d’importation CSV d’Airtable. Plus spécifiquement, la bonne utilisation de son option d’ajout en absolu ou de façon incrémentale a été essentielle (pour des données de clients, on veut ajouter seulement les nouveaux, et mettre à jour ceux qui étaient déjà présents dans la base; pour les données de ventes, on veut toujours tout compiler).
Enfin, le défi du volume de données est toujours d’actualité. L’équipe du Trident est en contact avec Airtable pour savoir s’il est possible d’obtenir des forfaits permettant de traiter un plus grand volume.
Si vous voulez en savoir plus sur la solution Airtable, nous vous invitons à visionner l’enregistrement de la conférence en ligne offerte par la CPN sur le sujet.
De plus, nous publierons des suites aux articles de la présente série si de nouvelles informations s’ajoutent. Assurez-vous d’être abonnés à l’infolettre de la CPN ou membre du groupe Facebook pour être recevoir l’information.
De plus, n’hésitez pas à prendre rendez-vous à la Clinique de la CPN si vous souhaitez discuter du sujet avec nous!
Les icônes utilisées dans les schémas sont tirées de The Noun Project : Software de Adrien Coquet, CSV de StoneHub, spreadsheet de Erickson Duverge et database de Vectors Point.
Les saisies d’écran illustrent la base Airtable du Théâtre du Trident et sont reproduites (avec des données anonymisées) avec autorisation.
Vous vous demandez ce qu’est la gestion intégrée des données et pour quelles raisons vous devriez vous y intéresser? Il s’agit d’un vaste sujet qu’on tentera bien humblement de vous expliquer dans cette chronique numérique du Conseil de la culture à partir de cinq questions brèves.
lirePour les organismes culturels et les artistes, le fait d’avoir un site internet est une façon d’exister dans l’univers du web. Ce n’est pas la seule façon, direz-vous. Bien sûr que non! La liste de plateformes nous permettant d’avoir un profil, de publier de l’information, de diffuser des vidéos et des balados, de partager des photos et plus encore est quasi infinie! C’est fort utile pour la promotion et pour la visibilité. Mais est-ce suffisant?
lireLes Chroniques numériques, c’est le moyen de communication que le Conseil de la culture a retenu pour rassembler les connaissances numériques et pour favoriser l’appropriation de ses membres.
lireNous vous suggérons 5 guides à consulter à propos de la découvrabilité et des bonnes pratiques connues à ce jour (il s’agit d’une liste de références non exhaustive!).
lireLe numérique fait partie de nos vies. À défaut de tout connaître (et parce que ce n’est pas nécessaire de tout savoir), nous vous résumons à l’aide de mots clés, cinq concepts pour avancer avec confiance dans la voie numérique!
lireComme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Le deuxième texte de la série nous a permis de voir comment le Carrefour international de théâtre exploite ces données à travers des tableaux de bord […]
lireComme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. L’équipe du Carrefour international de théâtre le sait et a déployé, de façon itérative, différents outils pour exploiter ces données. Nous vous présentons ici le résultat […]
lireLes données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Elles contiennent évidemment de l’information utile d’un point de vue comptable. Mais se limiter à cette utilisation serait dommage. En effet, la billetterie peut être un levier pour la transformation numérique de l’organisation. Les données d’usage (ventes, […]
lireCet article présente les faits saillants que nous avons notés au fil de la lecture du «Rapport du comité de réflexion sur la diffusion des arts de la scène au Québec» et du plan d’action publiés par le Conseil des arts et des lettres du Québec.
lireCe document sert à la fois de guide et de listes de choses à ne pas oublier pour documenter les besoins d’une organisation qui veut développer (ou améliorer) un site web. Le document d’une douzaine de pages présente plus de vingt thèmes importants à documenter.
lire