Data Mesh : le pouvoir aux métiers
Le Data Mesh, paradigme abstrait ou approche concrète de l’exploitation de la donnée ? Si la donnée « en tant que produit » peut apparaître complexe à cerner, la démarche repose sur une bonne organisation d’entreprise, une gouvernance solide et l’exploitation d’outils complémentaires innovants. Avec, à la clé, une reprise en main des métiers sur leurs données, pour beaucoup plus d’efficacité opérationnelle.
Le concept Data Mesh
Présenté pour la première fois par Zhamak Dehghani, mère du concept, le Data Mesh est une approche sociotechnique décentralisée dans la gestion et l’accès aux données analytiques de l’entreprise à grande échelle. Cette approche prend en compte à la fois l'évolution des besoins métiers ainsi que les évolutions technologiques. Ce concept est dit « orienté domaine », c’est-à-dire par métier : ventes, comptabilité, service client, marketing, etc.
Elle a pour grand avantage de donner les moyens aux collaborateurs de développer des services data rapidement, pour une utilisation en interne comme en externe, sans devoir en passer par une équipe centrale en charge de la donnée de l’entreprise. Les métiers disposent donc d’une plus grande autonomie et, parce qu’ils sont les producteurs de la donnée qu’ils exploitent, à des fins de nouveaux services, ils sont plus efficaces.
Promesses et pivot culturel du Data Mesh
Innovation accrue, meilleure efficacité en interne, meilleure allocation des ressources et des compétences, le Data Mesh (ou maillage de données) élimine les traditionnels goulots d’étranglement que les entreprises, lancées dans une stratégie datacentric, incriminent généralement.
La compréhension de la donnée que l’on attribue à leurs producteurs (les métiers) leur permet de définir eux-mêmes les politiques de gouvernance, sur la base de la documentation, la qualité et les accès spécifiés en amont. C’est cette autonomie qui permet l’utilisation en self-service de la donnée.
En conséquence de quoi, l’approche Data Mesh implique un changement culturel dans la façon dont on perçoit la donnée en entreprise. La donnée n’est plus une simple matière première isolée, impliquée dans un processus. Elle devient un produit (numérique), un service à part entière, auquel ses utilisateurs accèdent par le biais d’interfaces. Ils sont alors responsables de ce produit, disposent de la liberté de l’analyser et de l’exploiter, de gérer son cycle de vie, de le partager et de le promouvoir.
Les conditions de mise en œuvre du Data Mesh
La notion de maillage a toute son importance. Le Data Mesh a pour but de rendre la donnée disponible dans des sous-domaines destinés à chaque service, et ce, quels que soient les choix technologiques qu’a pu faire l’entreprise auparavant : datalake, datawarehouse, etc.
Pour permettre une gestion locale des données, dans sa dimension décentralisée, l’entreprise doit donc au préalable disposer d’une vision très claire de sa gouvernance. Elle devra alors identifier les domaines d’activité qui lui sont propres et définir les responsabilités en matière de gestion des données pour chacun.
Il lui appartiendra ensuite de mettre en place l’infrastructure de données appropriée pour activer concrètement l’approche Data Mesh, sans omettre de former ses équipes aux nouvelles méthodes de travail et aux nouveaux outils disponibles.
Comment mettre en œuvre le Data Mesh ?
De ces réflexions, il ressort que la mise en œuvre du Data Mesh inclut notamment les 3 piliers suivants :
- Une gouvernance fédérée, donnant un cadre centralisé et une visibilité globale sur les responsabilités par domaine, et les politiques de sécurité et de conformité.
- La virtualisation de la donnée, dans une Logical Data Fabric, afin de publier, définir, comprendre et découvrir les données dans tous les domaines, quel que soit le mode de stockage et de gestion des données.
- Une plate-forme d’infrastructure de données en libre-service, physique, disposant de son catalogue de données, sa boutique de données et ses connecteurs.
Si le sujet vous intéresse, découvrez la suite de notre série avec notre article consacré à la Logical Data Fabric.