Qu'est-ce que Data Fabric ?

Publié: 2022-02-14

Il est indiqué que la fabrique de données est un élément indispensable pour toutes les organisations centrées sur les données. Au cours des dernières années, cette terminologie a été très pertinente avec la gestion des données d'entreprise et les intégrations de données d'entreprise. Selon le cabinet d'analystes Gartner, la structure de données est considérée comme le top 10 des tendances en matière de données et d'analyse pour 2021. Gartner estime également que d'ici 2024, près de 25 % de chaque fournisseur de gestion de données fournira une solution complète de structure de données. Ce sera un bond énorme par rapport à la contribution actuelle de 5 %.

Dans cet article
  • Définition de la structure de données
  • Besoin de data fabric
  • L'architecture
  • Capacités clés
  • La comparaison
  • Cas d'utilisation de Data Fabric
  • Avantages de Data Fabric

Qu'est-ce que la fabrique de données ?

Pour le dire simplement, la structure de données est une architecture simplifiée, unifiée et unique qui englobe un ensemble intégré de technologies et de services. Cette collection est créée pour fournir des données intégrées et enrichies en utilisant la bonne méthodologie, au bon client de données et au bon moment ; traitant à la fois des travaux opérationnels et analytiques.

La structure de données comprend des technologies clés de gestion des données telles que le catalogue de données, la gouvernance des données, l'intégration des données, la canalisation des données et l'orchestration des données.

Source : Gartner Inc. et/ou ses sociétés affiliées

Pourquoi avez-vous besoin de Data Fabric ?

L'une des raisons fondamentales pour lesquelles les organisations ont besoin d'une structure de données est qu'elle sert de nombreux moteurs d'alignement de nature commerciale, technique et organisationnelle.

Moteurs d'activité

  • Pour les conducteurs d'entreprise, la structure de données aide à réduire le temps d'accès aux informations et contribue à un processus plus rapide de prise de décision éclairée. Cela se fait en canalisant rapidement les données dans des entrepôts de données et des lacs de données.
  • La structure de données aide également à fournir une vue à 360 degrés en temps réel de tous les aspects d'une entité commerciale tels que les clients, les fournisseurs, les commandes, la livraison, le produit, etc.

Pilotes organisationnels

  • La structure de données sert de langage commun entre les ingénieurs de données et les consommateurs de données, contribuant ainsi à une meilleure collaboration entre les équipes commerciales et les équipes de données.
  • Il existe des capacités d'accès aux données en libre-service qui permettent aux consommateurs d'obtenir les données dont ils ont besoin, et à tout moment.

Pilotes de gestion des données

  • La gestion de la préparation des données aide les data scientists et les autres ressources informatiques à éviter d'entreprendre toute sorte de tâches répétitives autour de l'enrichissement, de la transformation et du nettoyage des données.
  • Grâce à la structure de données, on peut accéder à n'importe quel type de données à l'échelle de l'entreprise en utilisant n'importe quelle méthode. Cela inclut le déplacement de données en bloc, la virtualisation des données et même les API.
  • La structure de données rationalise et intègre également les outils de gestion de données actuels utilisés dans l'organisation et optimise les autres outils redondants pour améliorer la rentabilité.

L'architecture de Data Fabric

Une architecture de structure de données bien définie est de nature modulaire et prend en charge un déploiement à grande échelle qui peut être multi-cloud, sur site ou même un déploiement hybride. Pour une architecture Data Fabric, les sources de données vont de nombreux systèmes hérités qui fonctionnent en silos aux derniers environnements cloud.

Le schéma suivant donne une idée de l'architecture de Data Fabric

Source : Gartner Inc. et/ou ses sociétés affiliées

Les consommateurs de Data Fabric comprennent des scientifiques et des analystes de données, des analystes marketing, des analystes commerciaux et des ressources qui travaillent sur la confidentialité des données avec des architectes cloud.

Fonctionnalités clés de la structure de données

Voici l'ensemble des fonctionnalités clés prises en charge par Data Fabric lorsqu'il est intégré dans une plate-forme unifiée unique :

  1. Catalogue de données
    Pour catégoriser, classer et placer les actifs de données dans une structure d'inventaire appropriée, les présentant ainsi visuellement.
  1. Ingénierie des données
    Développer des pipelines de données fiables à des fins analytiques et opérationnelles
  1. Gouvernance des données
    Pour garantir la qualité des données et également pour se conformer aux réglementations et protocoles concernant la confidentialité des données, la sécurité des données et l'évolutivité
  1. Préparation des données
    Il s'agit de définir le processus de flux de données, qui comprend également les étapes impliquées dans le nettoyage, l'enrichissement, la transformation et la validation des données.
  1. Intégration de données et livraison de données
    Cela implique d'extraire ou de récupérer des données à partir de n'importe quelle source fiable, puis de les mettre à la disposition du consommateur de données pour un traitement ultérieur. Cela se fait via des API, ETL, etc.

En plus des capacités de base mentionnées ci-dessus, il existe également certaines capacités non essentielles, que la structure de données apporte à la table.

Ceux-ci sont les suivants :

  1. Échelle, volume et performances des données
  2. Accessibilité
  3. Distribution
  4. Sécurité

Comparaison entre Data Fabric/Data Lake/Base de données pour les charges de travail opérationnelles

Pour vous aider à comprendre l'importance de la structure de données, examinons une comparaison entre les avantages et les inconvénients de diverses sources de données

Diverses sources de données Avantages Les inconvénients
Lac de données, entrepôt de données Prise en charge des requêtes de données sur de nombreuses données structurées et non structurées

Pas vraiment optimal pour les requêtes de données à entrée unique qui entraînent des réponses lentes.

Ne prend pas en charge les données en direct, les mises à jour continues des données ne sont donc pas fiables.

Aucune base de données SQL Prend en charge l'évolutivité linéaire via une architecture de datastore distribuée Ne prend pas en charge SQL, il nécessite donc des compétences spécialisées
Structure de données • Prise en charge complète de SQL
• Prend en charge l'évolutivité linéaire via une architecture de datastore distribuée
• Prend en charge une simultanéité élevée avec des performances en temps réel
• Prend en charge les requêtes complexes pour les entités commerciales uniques
• Prend en charge toutes sortes de méthodologies d'intégration
• Structure de gouvernance des données flexible et dynamique
N / A

Bien que la structure de données constitue une technologie supérieure pour les charges de travail opérationnelles à grande échelle, il s'agit également d'une solution qui agit comme une technologie réciproque pour le lac de données et les entrepôts de données. Pour une telle quantité de charges de travail de données, une structure de données peut :

1. Transférez-y des données fraîches et fiables, à des fins d'analyse hors ligne.
2. Recevez de leur part des informations commerciales à intégrer dans des cas d'utilisation opérationnels en temps réel.

Cas d'utilisation de Data Fabric

Dans les opérations de l'entreprise, il existe de nombreux cas d'utilisation qui nécessitent une architecture de données à grande échelle et à grande vitesse capable de prendre en charge plusieurs transactions. Ces exemples incluent :

  • Offrir une vue client à 360 degrés

    Fournir une vue complète et unique des clients via des systèmes CRM, IVR ou un portail client en libre-service.

  • Adhérer aux lois sur la confidentialité des données

    En adoptant un flux de travail flexible et une solution d'automatisation des données qui respecte la conformité entre les personnes, les systèmes et les données.

  • Données de test à la demande

    Aider à créer un entrepôt de données de test et partager des données de test anonymes avec divers centres de données, en maintenant une intégrité totale

Avantages de Data Fabric

Il existe une pléthore d'avantages de la structure de données par rapport à certaines des méthodologies de gestion de données traditionnelles/alternatives.

  • Amélioration de la gestion des données
  • Services de données étendus
  • Haut niveau de cohérence, de disponibilité et de durabilité
  • Sécurité extrêmement stricte
  • Haute performance

Dernières pensées

Les équipes qui ne veulent pas avoir une seule solution de Data Fabric pour l'analyse des données et une autre solution pour l'intelligence opérationnelle. Ils préfèrent généralement avoir une seule structure de données pour les deux.

Autres ressources utiles :

5 étapes pour créer une culture axée sur les données | TechFunnel

12 conseils pour développer la littératie des données en 2022 | Entonnoir technologique

Hub de données – Tout ce que vous devez savoir | Entonnoir technologique