La Data Gouvernance : Clé de voûte d’un marketing piloté par la donnée

Data Gouvernance

Introduction

 

L’exploitation des données a transformé la manière dont les activités et stratégies marketing sont pilotées au sein de l’ensemble des secteurs d’activité. La donnée, pour être source de valeur pour une entreprise, doit faire l’objet d’une somme d’opérations : collecte, analyse, unification, visualisation, activation, monétisation.

 

Ces traitements successifs constituent la chaîne de valeur de la donnée. Toutefois, pour que celle-ci suive son bon déroulé, encore faut-il établir des règles claires et une organisation efficace à chaque étape. C’est précisément l’enjeu qu’adresse la Data Gouvernance, dont l’objet est d’établir l’ensemble des règles, procédures et responsabilités qui assurent la qualité, la fiabilité, la sécurité et l’accessibilité des données tout au long de leur cycle de vie.

 

L’usage croissant des données au sein des entreprises – parce qu’elles ont démontré leur potentiel en tant que levier de croissance – a établi de fait la gouvernance des données comme l’élément central d’une stratégie performante.

 

De la nécessité de définir une gouvernance

 

Passé l’ère de la collecte des données et du Big Data, les entreprises font désormais face à un amas de données volumiques et éparses, provenant de sources de données nombreuses et disparates, dont les empilements technologiques successifs compliquent les capacités d’interconnexions. 

 

La gouvernance de la donnée apporte des solutions concrètes à un enjeu stratégique majeur des organisations : rationaliser et rendre utile et efficace les données accumulées. Et ce, alors que de nouveaux outils et de nouveaux métiers du marketing complexifient les processus, les volumes et justifient des croisements plus contraignants à exploiter.

 

Désormais, la donnée devient source de valeur par le prisme de nombreux enjeux associés à la gouvernance :

 

    • La qualité
        • trier, filtrer, re-qualifier les sources, leur nature et leur contenu
        • réconcilier, agréger et préparer les ensembles de données
        • servir des objectifs métiers et aligner les intérêts dans une société

 

    • La performance, la conformité et la sécurité
        • compartimenter les blocs de données et optimiser la granularité
        • assurer le respect des normes légales de collecte, de stockage et de rétention
        • sécuriser hiérarchiquement les accès aux données dans un contexte de cloud

 

    • L’accessibilité
        • offrir des accès aux sources brutes pour les utilisateurs avancées
        • traduire les données en interface d’aide à la décision pour tous les utilisateurs
        • conduire le changement par la documentation, l’évangélisation et la formation

 

Et par conséquent :

    • La coordination
        • responsabiliser la collecte, la gestion et la maintenance
        • assurer l’évolutivité avec les besoins et les contraintes
        • réduire les silos en favorisant la collaboration autour d’objectifs communs

 

En parallèle, les enjeux sociétaux et climatiques viennent percuter et s’imposer au sein des feuilles de route des entreprises — les amenant à accroître les efforts en gouvernance de la donnée pour y répondre :

    • Les consommateurs ont développé une sensibilité accrue à l’usage qui est fait de leurs données – porté par un contexte réglementaire de plus en plus fort.
    • Les enjeux climatiques viennent rappeler une réalité pragmatique quant au poids énergétique du stockage et des traitements sur les données.

 

L’objectif de la gouvernance des données est donc de construire les piliers d’une exploitation fiable, sécurisée, conforme et accessible d’une part. Et plus important encore, la gouvernance à pour objectif ultime d’assister les métiers dans leurs prises de décisions, c’est-à-dire de fournir des solutions concrètes malgré les contraintes associées.

 

 

 

Les enjeux stratégiques de la gouvernance

 

Parmi les enjeux de la data gouvernance, un aspect primordial en particulier justifie la mise en place d’une telle démarche : l’accessibilité. Elle se présente sous de nombreuses formes, se base sur la qualité et la fraîcheur des données et doit permettre la lecture et la prise de décisions.

 

La visualisation, appelée aussi dataviz, constitue le pinacle de l’accessibilité. En effet, c’est la forme de la donnée qui la rend la plus utile et exploitable au plus grand nombre, et ce en permettant de prendre des décisions objectives et de confronter les impacts de ces décisions par la suite.  La dataviz peut prendre la forme de rapports, de tableaux de bords ou encore d’infographies, en fonction de leur(s) usage(s) et surtout du public cible. L’enjeu est généralement d’offrir au lecteur la responsabilité d’interpréter ces chiffres. Le rapport implique souvent de recalculer et de juger des performances, là où le tableau de bord met en évidence les grands phénomènes. Tandis que l’infographie va jusqu’à commenter et guider la lecture.

 

Les chiffres lorsqu’ils sont mis en perspective, et restitués de façon comparable permettent de devenir un instrument de prise de décision stratégique. Cela suppose donc une responsabilité d’où l’importance de la gouvernance  : Qui construit et valide les visualisations ? Qui choisit les indicateurs ou bien leur “proxy” ? Tout n’est pas mesurable, et on doit souvent se contenter d’une mesure alternative d’un phénomène trop complexe, voire imperméable à la mesure. Choisir d’afficher un chiffre pour définir le niveau d’engagement par exemple révèle d’un choix significatif, et qui a des conséquences sur les actions menées. 

 

L’accessibilité se vit aussi à travers la qualité et la fraîcheur des données. Il faut s’interroger sur le délai de lecture des indicateurs pour prendre des décisions au bon moment. Tout comme, la pertinence et la précision des indicateurs est primordiale pour influencer les stratégies. Or, ces deux critères sont potentiellement incompatibles, il faut alors imaginer des compromis et informer sur leur existences et leurs conséquences.

 

Compte tenu de la multiplicité des outils, les croisements de données permettent d’avoir une vision plus holistique des performances. Mais cela implique généralement une complexité grandissante d’accessibilité lorsqu’il s’agit de les obtenir et de les interpréter. Ici, on devine la nécessité de choisir entre la responsabilité d’un centre de service pour préparer les données, ou bien de former les utilisateurs finaux à des méthodes plus avancées. Dans les deux cas, pour répondre à ces enjeux, on voit naturellement apparaître de nouveaux métiers comme Data Manager, Data Product Owner ou encore Data Steward. Ce sont des métiers dont les compétences et les responsabilités se croisent. 

 

Ces métiers aux champs de compétences vastes ne sont pas encore pleinement intégrés dans les organisations. Or, la mise en place d’une data gouvernance permet d’y répondre en proposant une définition claire des rôles et responsabilités. Des informations pouvant être communiquées au sein des organisations, quel que soit leur rapport aux données.

 

 

Exemple   Data Manager    Product owner   Data Steward
 

Ses missions

   

  • Est responsable des bases de données et de leur exploitation
  • Conçoit l’architecture des bases de données et des mécanismes associés en amont et en aval
  • Assure la qualité et la sécurité des données en continue
   

  • Fait l’interface entre l’utilisateur, les équipes de développement et les métiers
  • Contribue à la réalisation de la roadmap du projet
  • Encadre les projets techniques avec un rôle opérationnel
   

  • Assure que les données sont présentes, sécurisées, conformes et comprises
  • Détient la connaissance métier de toutes les données
  • Garantie la qualité des données
  • Veille au respect des normes et partage les bonnes pratiques avec les équipes

 

 

La data est un outil de pilotage indispensable au sein des entreprises pour prendre des décisions, conforter ses convictions ou encore gagner en efficacité. En effet, aujourd’hui l’exploitation des données démystifie certaines convictions ou opinions obsolètes. Bien qu’il ne soit pas illégitime d’écouter le discours de l’expérience ou de l’intuition, il s’agit bel et bien de le confronter aux données ! La data ne doit non plus limiter la créativité, l’intuition et la prise de risque car c’est aussi cela qui va permettre de proposer des contenus particuliers, de prendre des partis pris payants et de mettre en avant la singularité d’une marque.

 

 

Définir et construire la gouvernance des données

 

La data gouvernance doit construire sa feuille de route à l’aide des priorités stratégiques et de la faisabilité. C’est à ce stade que les experts peuvent entrer en jeu, car la faisabilité implique de considérer les moyens à disposition, ceux qui sont manquants et bien évidemment comment les articuler pour atteindre les objectifs. 

 

Pour ce faire, la constitution d’une équipe experte est nécessaire avec des ingénieurs, data engineer, des data analyst, des analytics engineers plus proches des langages d’exploitation et des experts des outils. En parallèle, il est également primordial d’identifier des outils de collecte, de processing, de stockage, de mise à disposition de la donnée qui répondront aux différents objectifs. Cela permettra d’obtenir une vision claire de la feuille de route de mise en œuvre de la gouvernance de données.

 

 

Data Engineer  
  • Développe et assure la maintenance l’infrastructure définie avec le Data Architect
  • Fait évoluer l’infrastructure en tenant compte de l’émergence des nouvelles technologies et solutions
    (C++, SQL, R, Python, Matlab, etc.)
  • Veille à la sécurité et la clarté des pipelines déployés

 

Data Scientist  
  • Explore les sources de données
  • Tire profit des technologies de pointe pour combiner mieux les méthodes d’analyses
  • Construit des algorithmes
  • Conçoit les modèles prédictifs et les industrialisent
    (en collaboration avec le Data Architect et le Data Engineer)

 

Data Analyst  
  • Comprendre les problématiques métiers
  • Enrichir le catalogue de données de l’entreprise et favoriser la connaissance transversale
  • Explorer et comprendre les données traitées
  • Automatiser et industrialiser des reportings
  • Vulgariser la donnée pour toutes les expertises

 

Data Architect  
  • Organise la récupération des données brutes une fois les fondations posées
  • Optimise les infrastructures de collecte et de stockage
  • Propose des modélisations plus adaptées
  • Redimensionne l’ensemble si nécessaire afin de répondre aux enjeux métiers

 

Analytics Engineer  
  • Met en place des modèles Data robustes, efficaces et intégrés pour modéliser les données brutes en ensembles de données
  • Conçoit, construit et de maintien des systèmes et des processus de collecte, de stockage et d’analyse des données
  • Fait le trait d’union entre le Data Analyst et le Data Engineer pour gagner en efficacité

 

 

 

Un point de vigilance reste à prendre en compte : la mise à l’échelle d’une stratégie data gouvernance que ce soit dans une optique de volume ou de compatibilité avec tous les leviers stratégiques concernés in fine.

 

La mise en place d’un Proof Of Concept sur la gouvernance des données peut permettre de démontrer l’intérêt final et valider la faisabilité théorique. Il doit avoir un objectif à la fois ambitieux (tirer un bénéfice immédiat et fort), mais aussi être techniquement raisonnable pour atteindre son objectif de confrontation rapide à la réalité du quotidien. Cela permet aux équipes d’éviter un effet tunnel et d’assurer la mise en place d’une stratégie de data gouvernance adéquate et efficace en se remettant en question pour s’adapter aux contraintes et besoins qui peuvent évoluer dans le temps. Cette approche permet de construire une stratégie adéquate qui s’adapte aux contraintes.

 

Dans le choix des solutions, outils, partenaires et langages, il convient de considérer les standards du marché pour gagner en efficacité ; ces solutions sont généralement aussi des outils clés en main. Il convient de considérer les besoins à travers une approche en briques indépendantes pour faciliter l’évolutivité et la maintenance en interne, afin d’éviter les “boîtes noires”. Enfin, si les données sont au cœur de vos enjeux stratégiques, il convient d’envisager l’intégration des compétences au plus tôt pour être indépendant et maître de ses environnements techniques fournissant des données stratégiques.

 

En conclusion, une pratique sans nul doute primordiale consiste à documenter tout ce qui est réalisé, ce qui est prévu, ce qui fonctionne à date ainsi que les règles d’exploitation de l’écosystème : Data Model, Data Catalog. Cette documentation permet de pérenniser l’ensemble de l’écosystème en place, de permettre aux utilisateurs finaux d’exploiter sereinement les données et d’assurer des facilités de maintenance et d’évolution dans un environnement changeant (besoins, employés, conformité). Cela devient généralement indispensable pour assurer une conformité avec la RPGD et l’assurance de pouvoir la démontrer.

 

 

 

La gouvernance, un investissement à long terme

 

Fort de ces notions, on perçoit les investissements humains technologiques nécessaires dans le cadre de ces chantiers. Néanmoins les bénéfices associés sont nombreux à court et à moyen terme pour la vie de la société. Afin de mettre en place une démarche de data gouvernance, dans la définition des chantiers et de la feuille de route, il est essentiel de prioriser les actions pour favoriser un cercle vertueux. La première étape qui consiste à récolter les besoins et faire l’état des lieux de la réponse disponible en termes de données permet d’anticiper les besoins de futurs chantiers. Mais elle a aussi pour but d’identifier des manquements simples à résoudre en l’état, puis les priorités relatives à terme.

 

A court terme, l’essentiel est de ré-aligner les objectifs du modèle économique de la société et d’en déduire des indicateurs de performance, idéalement déjà disponibles, dans toutes les directions métiers. Ainsi, toute action devra être menée au regard des données : on parle alors de décisions data-driven. Mécaniquement on doit s’attendre à une amélioration des actions marketing et du retour sur investissement, à la fois des actions, mais aussi de la démarche de gouvernance des données dans son ensemble.

 

La gouvernance des données est une démarche qui tend à rompre les silos puisqu’elle s’intègre dans l’ensemble des directions métiers et s’adresse à tous. Il s’agit donc de définir les rôles, de fédérer les équipes et d’assurer la conduite du changement à travers des instances, des rituels et des mécaniques décisionnelles. L’amélioration continue repose sur un choix d’outils, de processus, de culture et sur les données : elle doit être au cœur de la gouvernance. 

 

A moyen-terme, la complétion des données disponibles et surtout leurs croisements permettra d’améliorer la connaissance client et de proposer de nouveaux cas d’usage, avec la perspective de proposer un suivi universel des parcours client. On pense notamment à la réconciliation des données offline et online. En proposant des outils d’aide à la décision, on permet aux équipes de gagner en efficacité ainsi qu’en maturité dans leur exploitation des données. C’est ce qui amène au pilotage de plus en plus resserré des projets et des campagnes de communication. Par la suite, ce sont ces équipes qui vont solliciter de nouveaux progrès dans le suivi de leur performance jusqu’au sommet de la data science : la prédiction pour tester des scénarios, l’exploration assistée des données ou encore l’optimisation des groupes de clients par exemple.

Les moyens et les outils mis en place devront se rapprocher progressivement des besoins. Si auparavant le marché s’est beaucoup concentré sur les notions de data lake ou de data warehouse, à raison, il s’agit désormais de répondre aux besoins métiers à travers un data mart et/ou un data mesh. Autrement dit, la mise en service de données préparées pour les besoins des utilisateurs finaux.

 

 

Définitions   Avantages Limites
 

Data Lake

 

Une plateforme de stockage de données qui permet de stocker de grandes quantités de données structurées et non structurées de différentes sources et de différents formats. Le data lake est souvent utilisé comme une source de données pour l’analyse et l’exploration de données.

 

  • la capacité à stocker une grande quantité de données de différentes sources
  • la possibilité de conserver les données brutes pour une utilisation ultérieure
  • la capacité de traiter rapidement de grandes quantités de données
 

les data lakes peuvent être difficiles à gérer et à maintenir sans une architecture bien conçue et des outils adéquats

  • peuvent être coûteux à mettre en place et à gérer
  •  peuvent également être difficiles à utiliser pour les utilisateurs non techniques.
 

Data warehouse

 

Un système de stockage de données structurées qui permet de stocker et de traiter de grandes quantités de données à des fins d’analyse et de reporting. Les données sont généralement chargées dans le data warehouse depuis des bases de données relationnelles et sont structurées de manière à être facilement accessibles

 

 

  • la capacité à stocker et à traiter une grande quantité de données structurées
  • la possibilité d’exécuter des analyses complexes et des requêtes sur les données
  • une performance de requête rapide grâce à l’utilisation d’index et de résumés précalculés.

 

 

  • les data warehouses peuvent être coûteux à mettre en place et à maintenir
  • nécessitent une gestion attentive des schémas et des métadonnées.
 

Data Mesh

 

Une approche de gestion des données qui vise à créer une infrastructure de données flexible et autonome qui est conçue pour être facilement accessible et utilisable par tous les membres de l’organisation. Le data mesh vise à promouvoir l’autonomisation des équipes et à renforcer la confiance dans les données de l’organisation en créant une culture de gestion de données axée sur la collaboration et l’autonomisation.

 

 

  • la possibilité de fournir une vue unifiée et cohérente de toutes les données de l’entreprise
  • l’encouragement de l’autonomisation des équipes et de la responsabilisation en matière de données
  • la facilité d’accès aux données pour les utilisateurs.
 

  • le data mesh peut être difficile à mettre en place et à maintenir
  • Nécessite une stratégie de données claire et une collaboration étroite entre les différentes équipes de l’entreprise
  • Peut être coûteux à mettre en place et à gérer
 

Data Mart 

 

Une plateforme de stockage de données qui est conçue pour stocker et traiter de grandes quantités de données structurées pour l’analyse et la prise de décision. Les data marts sont généralement alimentés par des données extraites de sources de données spécifiques et sont conçus pour être facilement interrogés par des outils d’analyse de données.

 

  • Peut stocker et traiter une grande quantité de données structurées
  • Permet d’exécuter des analyses complexes et des requêtes sur les données
  • Offre une performance de requête rapide grâce à l’utilisation d’index et de résumés précalculés

 

 

 

  • Peut être difficile à intégrer à d’autres systèmes de données de l’entreprise
  • Peut être difficile à maintenir et à mettre à jour si les données proviennent de sources multiples

 

 

La maîtrise de la chaîne de valeur engage aussi la voie vers plus de modularité. Une caractéristique qui favorise l’indépendance et évite les situations de “boîtes noires”. Le changement d’échelle, notamment, nécessite généralement de réévaluer les mécaniques de traitement des données. Par ailleurs, cette démarche s’inscrit également dans le cadre du RGPD puisque cela assure la maîtrise et la documentation des finalités de l’usage des données personnelles.

 

Enfin, à plus long terme, les nouvelles tendances pourront être identifiées plus rapidement à travers le prisme des données de comportements. Et par la même, il sera possible de moduler rapidement les pratiques par le biais de la gouvernance des données pour répondre aux nouveaux enjeux du marché. 

Partager l'article: