Co to jest sieć danych?

Opublikowany: 2022-02-14

Mówi się, że struktura danych jest niezbędnym elementem dla wszystkich organizacji, które są zorientowane na dane. Od kilku lat ta terminologia jest dość istotna w przypadku zarządzania danymi przedsiębiorstwa i integracji danych przedsiębiorstwa. Według firmy analitycznej Gartner, data fabric jest uważana za 10 największych trendów w zakresie danych i analiz w 2021 roku. Gartner szacuje również, że do roku 2024 prawie 25% każdego dostawcy usług zarządzania danymi będzie dostarczać kompleksowe rozwiązanie Data Fabric. Będzie to ogromny skok w stosunku do obecnego wkładu 5%.

W tym artykule
  • Definicja sieci danych
  • Potrzeba tkaniny danych
  • Architektura
  • Kluczowe możliwości
  • Porównanie
  • Przypadki użycia Data Fabric
  • Zalety Data Fabric

Co to jest tkanina danych?

Mówiąc prościej, struktura danych to uproszczona, ujednolicona i pojedyncza architektura, która obejmuje zintegrowany zestaw technologii i usług. Ten zbiór jest tworzony w celu dostarczenia zintegrowanych i wzbogaconych danych przy użyciu właściwej metodologii, do właściwego klienta danych i we właściwym czasie; zajmujących się zarówno pracami operacyjnymi, jak i analitycznymi.

Tkanina danych obejmuje kluczowe technologie zarządzania danymi, takie jak – katalog danych, zarządzanie danymi, integracja danych, potokowanie danych i orkiestracja danych.

Źródło: Gartner Inc. i/lub jej podmioty stowarzyszone

Dlaczego potrzebujesz Data Fabric?

Podstawowym powodem, dla którego organizacje potrzebują struktury danych, jest to, że obsługuje ona wiele czynników wyrównywania o charakterze biznesowym, technicznym i organizacyjnym.

Kierowcy biznesowi

  • Dla kierowców biznesowych struktura danych pomaga w skróceniu czasu dostępu do spostrzeżeń i pomaga w szybszym procesie podejmowania świadomych decyzji. Odbywa się to poprzez szybkie przesyłanie danych do hurtowni danych i jezior danych.
  • Tkanina danych pomaga również w dostarczaniu w czasie rzeczywistym 360-stopniowego widoku wszystkich aspektów jednostki biznesowej, takich jak klienci, dostawcy, zamówienia, dostawa, produkt itp.

Kierowcy organizacyjni

  • Sieć danych służy jako wspólny język między inżynierami danych a konsumentami danych, pomagając w ten sposób usprawnić współpracę między zespołami biznesowymi i zespołami danych.
  • Istnieją możliwości samoobsługowego dostępu do danych, które umożliwiają konsumentom uzyskanie potrzebnych danych w dowolnym momencie.

Sterowniki zarządzania danymi

  • Zarządzanie przygotowywaniem danych pomaga analitykom danych i innym zasobom IT uniknąć podejmowania wszelkiego rodzaju powtarzalnych zadań związanych ze wzbogacaniem, przekształcaniem i czyszczeniem danych.
  • Poprzez strukturę danych można uzyskać dostęp do dowolnego rodzaju danych z całego przedsiębiorstwa przy użyciu dowolnej metody. Obejmuje to masowe przenoszenie danych, wirtualizację danych, a nawet interfejsy API.
  • Data fabric usprawnia również i integruje obecne narzędzia do zarządzania danymi używane w organizacji oraz optymalizuje inne nadmiarowe w celu poprawy efektywności kosztowej.

Architektura Data Fabric

Dobrze zdefiniowana architektura sieci szkieletowej danych ma charakter modułowy i obsługuje wdrażanie na dużą skalę, które może być wdrożeniem wielochmurowym, lokalnym lub nawet hybrydowym. W przypadku architektury Data Fabric źródła danych obejmują wiele starszych systemów działających w silosach, a także najnowsze środowiska chmurowe.

Poniższy diagram daje wyobrażenie o architekturze struktury danych

Źródło: Gartner Inc. i/lub jej podmioty stowarzyszone

Konsumenci sieci danych to naukowcy i analitycy danych, analitycy marketingowi, analitycy sprzedaży oraz zasoby, które pracują nad prywatnością danych wraz z architektami chmury.

Kluczowe możliwości struktury danych

Poniżej przedstawiono zestaw kluczowych funkcji obsługiwanych przez strukturę danych, gdy jest ona zintegrowana z pojedynczą, ujednoliconą platformą:

  1. Katalog danych
    Aby kategoryzować, klasyfikować i umieszczać zasoby danych w odpowiedniej strukturze inwentarza, a tym samym prezentować je wizualnie.
  1. Inżynieria danych
    Opracowanie niezawodnych potoków danych do celów analitycznych i operacyjnych
  1. Zarządzanie danymi
    Aby zapewnić jakość danych, a także przestrzegać przepisów i protokołów dotyczących prywatności danych, bezpieczeństwa danych i skalowalności
  1. Przygotowywanie danych
    Chodzi o zdefiniowanie procesu przepływu danych, który obejmuje również kroki związane z czyszczeniem danych, wzbogacaniem, transformacją i walidacją danych.
  1. Integracja i dostarczanie danych
    Obejmuje to wyodrębnianie lub pobieranie danych z dowolnego wiarygodnego źródła, a następnie udostępnianie ich konsumentowi danych do dalszego przetwarzania. Odbywa się to za pośrednictwem interfejsów API, ETL itp.

Poza podstawowymi możliwościami, jak wspomniano powyżej, istnieją również pewne niezwiązane z podstawowymi możliwościami, które struktura danych przenosi do tabeli.

Są to:

  1. Skala, objętość i wydajność danych
  2. Dostępność
  3. Dystrybucja
  4. Bezpieczeństwo

Porównanie Data Fabric/Data Lake/Baza danych dla obciążeń operacyjnych

Aby pomóc Ci zrozumieć znaczenie struktury danych, przyjrzyjmy się porównaniu zalet i wad różnych źródeł danych

Różne źródła danych Plusy Cons
Data Lake, hurtownia danych Obsługa zapytań o dane w wielu danych strukturalnych i niestrukturalnych

Niezbyt optymalne dla zapytań o dane pojedynczego wpisu, które powodują powolne odpowiedzi.

Nie obsługuje danych na żywo, więc ciągłe aktualizacje danych nie są niezawodne.

Brak bazy danych SQL Obsługuje liniową skalowalność dzięki rozproszonej architekturze magazynu danych Nie obsługuje SQL, więc wymaga specjalistycznych umiejętności
Tkanina danych • Pełna obsługa SQL
• Obsługuje skalowalność liniową dzięki rozproszonej architekturze magazynu danych
• Obsługuje wysoką współbieżność z wydajnością w czasie rzeczywistym
• Obsługuje złożone zapytania dla pojedynczych podmiotów gospodarczych
• Obsługuje wszystkie rodzaje metodologii integracji
• Elastyczna i dynamiczna struktura zarządzania danymi
Nie dotyczy

Chociaż sieć danych służy jako doskonała technologia dla obciążeń operacyjnych na dużą skalę, jest to również rozwiązanie, które działa jako technologia wzajemna dla jeziora danych i hurtowni danych. W przypadku takiej ilości obciążeń danych sieć szkieletowa danych może:

1. Przesyłaj do nich świeże, zaufane dane do celów analitycznych offline.
2. Otrzymuj od nich spostrzeżenia biznesowe, aby móc je osadzić w operacyjnych przypadkach użycia w czasie rzeczywistym.

Przypadki użycia Data Fabric

W operacjach przedsiębiorstwa istnieje wiele przypadków, które wymagają dużej i szybkiej architektury danych, która jest w stanie obsłużyć wiele transakcji. Te przykłady obejmują:

  • Dostarczanie 360-stopniowego widoku klienta

    Dostarczanie kompleksowego i jednolitego widoku klientów za pośrednictwem systemów CRM, IVR czy portalu samoobsługowego klienta.

  • Przestrzeganie przepisów dotyczących prywatności danych

    Dzięki zastosowaniu elastycznego przepływu pracy i rozwiązania do automatyzacji danych, które jest zgodne ze zgodnością między ludźmi, systemami i danymi.

  • Testuj dane na żądanie

    Pomoc w tworzeniu testowej hurtowni danych i udostępnianiu anonimowych danych testowych różnym centrom danych z zachowaniem całkowitej integralności

Zalety Data Fabric

Tkanina danych ma wiele zalet w porównaniu z niektórymi tradycyjnymi/alternatywnymi metodologiami zarządzania danymi.

  • Ulepszone zarządzanie danymi
  • Rozszerzone usługi danych
  • Wysoki poziom spójności, dostępności i trwałości
  • Niezwykle szczelne zabezpieczenie
  • Wysoka wydajność

Końcowe przemyślenia

Zespoły, które nie chcą mieć pojedynczego rozwiązania Data Fabric do analizy danych i innego rozwiązania do analizy operacyjnej. Zwykle wolą mieć jedną strukturę danych dla obu.

Inne przydatne zasoby:

5 kroków do stworzenia kultury opartej na danych | TechFunnel

12 wskazówek dotyczących budowania umiejętności korzystania z danych w 2022 r. | Techfunnel

Data Hub – wszystko, co musisz wiedzieć | Techfunnel