Nouveau paradigme en matière de gestion de données
Vise à résoudre certains des problèmes associés aux architectures centralisées de données
Objectif: Permettre une gestion plus efficace et plus autonome des données au sein d'une organisation
Concepts:
Décentralisation des données
Données = produits gérés par des Domaines (= équipes autonomes)
Chaque application gère le domaine de données sur lesquelles elle est maître
Chaque domaine est défini en fonction de son propre contexte métier
Lorsqu'une donnée d'un domaine A est modifié par un domaine B elle doit être publiée sur le bus pour que le domaine A puisse prendre en charge la modification
Les données sont ensuite mises à disposition des autres via interfaces standardisées = Bus de données
Un EAI peut être utilisée pour la mise en œuvre (intégration plus efficace et cohérente)
Il est également possible d'établir un contact direct entre les applications
Avantages:
meilleure gouvernance des données
meilleure collaboration entre les équipes
réduction des dépendances et des coûts d'intégration
amélioration de la qualité des données
augmentation de la flexibilité et de l'agilité
meilleure utilisation des compétences et des ressources
Les données exposées par les domaines sont de bonnes qualité (normalisées, documentées)
Les runtime analytics peuvent requêter directement les API du bus de données pour obtenir les données
Si grosse volumétrique ou requêtes fréquentes alors il vaut mieux répliquer
Data Mesh vs Data Hub:
Data Hub = centraliser les données de différentes sources en un seul endroit, sans traitement, afin de permettre leur utilisation pour différents cas d'utilisation
Data Mesh = décentraliser la gestion des données
Un Data Hub peut compléter une approche Data Mesh pour un besoin spécifique de l'organisation
Il faudra faire attention à ne pas rompre les bénéfices de l'archi Data Mesh
ex: il ne doit pas être un point de passage obligé