Co to jest centrum danych? – Kompletny przewodnik

Opublikowany: 2021-08-20

Ekosystem wokół danych to ogromny wszechświat. Jest tak różnorodny, że każda organizacja, aby nadać sens temu, co dostępne, wymagałaby wdrożenia systemów do zarządzania, monitorowania, analizowania i interpretacji danych. Dla dzisiejszych przedsiębiorstw dane są głównym paliwem, które napędza wszystkie decyzje w organizacji. Jednak nawet przy tej krytyczności dane są przechowywane w izolowanych systemach, co utrudnia organizacji analizę danych. Niektóre z tych danych są przechowywane w hurtowniach danych lub centrach danych, a niektóre są tracone w tak zwanych jeziorach danych.

W tym artykule
  • Zdefiniuj centrum danych
  • Jak to działa?
  • Dlaczego centrum danych?
  • Rodzaje do poznania
  • Różnica między Data Hub a Data Lake
  • Korzyści
  • Przykłady technologii Data Hub

Co to jest centrum danych?

Centrum danych to nowoczesny system przechowywania danych, który pomaga organizacjom konsolidować i przechowywać dane z całego przedsiębiorstwa. Pozwala również firmom przesyłać dane do innych systemów, takich jak systemy Business Intelligence lub silniki AI, w celu dalszej analizy. Przedsiębiorstwa, które chcą obsługiwać dane w silosach, powinny zrozumieć, że posiadanie danych całkowicie usprawni ich proces zarządzania danymi i usprawni przepływ danych w całym przedsiębiorstwie.

Istnieje wiele technologii, takich jak hurtownie danych, nauka o danych i inżynieria danych, których kulminacją jest architektura centrum danych. To coś więcej niż technologia, może być uważane za metodologię zapewniającą skuteczność w zarządzaniu danymi i sposobem ich przechowywania, aby pomóc organizacjom w dalszym przetwarzaniu.

Jak działa centrum danych?

Po jego wdrożeniu każdy użytkownik, partner dostarczania lub operator musi zawrzeć umowę użytkowania, która daje im uprawnienia do bezpiecznego przesyłania danych do repozytorium centrum danych. Ma to na celu zapewnienie poufności danych, do których użytkownicy mają dostęp. Transfer danych odbywa się za pomocą bezpiecznej i uznanej metodologii integracji.

Zebrane dane są centralnie dostępne i ujednolicone. Następnie na zebranych danych zostanie przeprowadzona seria analiz w celu dostarczenia znaczących informacji w różnych działach, jednostkach operacyjnych i innych sektorach. Wreszcie dane są przesyłane z powrotem do odpowiednich systemów w celu dalszej konsumpcji. Wyjaśniono to na uproszczonym schemacie, jak wspomniano poniżej

Źródło diagramu: Dataversity(1)

Dlaczego centrum danych?

Głównym powodem, dla którego każda organizacja potrzebuje centrum danych, jest połączenie wszystkich punktów styku danych i udostępnienie danych w centralnej lokalizacji – technicznie określane jako integracja danych . Na podstawowym poziomie zapewnia możliwości subskrypcji. Jednak przy skutecznym wdrożeniu istnieje wiele innych czynników, które sprawiają, że jest to podstawa dla przedsiębiorstw

  • Bezpieczeństwo

    Większość firm egzekwuje środki bezpieczeństwa, definiując kontrolę dostępu określającą, kto może uzyskać dostęp do jakiego rodzaju danych. Na przykład firmy nie chcą udzielać dostępu do danych finansowych i kadrowych niektórym pracownikom lub prawdopodobnie dane klientów powinny być ograniczone tylko do zespołów sprzedaży i finansów. Posiadanie go zapewni, że hierarchia Twojej organizacji jest dobrze zdefiniowana, punkty dostępu do danych są dobrze sklasyfikowane, a kontrole są na miejscu.

  • Opłacalny

    Wyobraź sobie, że masz wiele systemów i jakoś zintegrowałeś te systemy, ale nie jest to bezproblemowe. Zainwestowałeś już w posiadanie tych indywidualnych systemów i zainwestowałeś dalej w integrację tych niezależnych systemów. Jednak ponieważ nie był to pełny dowód, nadal istnieje wyzwanie braku widoczności. Z czasem inwestycja ta staje się ogromnym wydatkiem operacyjnym. Jeśli ją zaimplementujesz, pozbędziesz się niechcianych punktów styku integracji i uzyskasz pojedynczą integrację punkt-punkt, dzięki czemu cały projekt będzie bardziej opłacalny.

  • Zręczny

    Wdrożenie centrum danych sprawia, że ​​cała platforma jest elastyczna. Przyspiesza integrację innych systemów biznesowych, a przepływ danych staje się szybki i płynny. W przypadku jej braku będzie również scenariusz, w którym systemy będą próbowały pobrać lub wywołać dane z innych systemów. Potem jest tworzenie punktów styku i interfejsów integracji, dodając tygodnie i tygodnie czasu wdrożenia. Dzięki temu wszystkie dane są dostępne w centralnej lokalizacji za pośrednictwem zestawu interfejsów API, zasad dostępu i dobrze zdefiniowanego procesu subskrypcji.

Rodzaje centrum danych

W tej sekcji przyjrzymy się różnym typom i jakie są różne typy punktów styku końcowego

  1. Master Data Hub: W tym typie punktami końcowymi są zazwyczaj systemy operacyjne. Dane są tworzone w centrum lub w punkcie końcowym
  2. Application Data Hub: Tutaj ponownie punktem końcowym danych jest system operacyjny. Różnica polega na tworzeniu danych, ponieważ w tym typie dane są tworzone w centrum, a nie w punkcie końcowym.
  3. Integration Data Hub: w tym typie tworzenie danych odbywa się w punktach końcowych. Te punkty końcowe mogą być różnego rodzaju, takie jak systemy operacyjne, narzędzia analityczne lub silniki lub dowolny podmiot zewnętrzny.
  4. Referencyjne centrum danych: w tym typie dane są tworzone i przechowywane w centrum lub na końcu, w zależności od scenariusza biznesowego. Tutaj również punkty końcowe są podobne do koncentratorów danych integracji, takich jak systemy operacyjne, narzędzia lub silniki analityczne, lub dowolny podmiot zewnętrzny.
  5. Centrum danych analitycznych: centra danych analitycznych przechowują lub tworzą dane tylko na punktach końcowych, które są systemami operacyjnymi.

Centrum danych a jezioro danych

Jeśli spojrzymy na hurtownie danych, jeziora danych i centra danych, ludzie mówią, że są one zamienne. Są jednak pod pewnymi względami różne i zazwyczaj się uzupełniają. Przyjrzyjmy się porównaniu między centrum danych a jeziorem danych.

Centrum danych Jezioro danych
Wykorzystanie podstawowe dotyczy procesów operacyjnych. Data Lake służy przede wszystkim do analiz, uczenia maszynowego i raportowania.
Zwykle jest to uporządkowany zbiór danych. Dane takie jak mogą być ustrukturyzowane i nieustrukturyzowane.
Rygorystyczny proces zarządzania w celu egzekwowania reguł. Nie ma ścisłego zarządzania egzekwującego zasady dostępu do jezior danych.
Jakość danych zarządzanych w centrum danych jest niezwykle wysoka. Jakość danych przechowywanych i zarządzanych w Data Lake jest średniej lub niskiej jakości.
Zapewnia integrację w czasie rzeczywistym z dwukierunkowym przepływem danych z/do innych systemów. Przepływ danych jest całkowicie jednokierunkowy, co zwykle odbywa się w partiach ETL lub ELT.

Oprócz wyżej wymienionych różnic centrum danych jest przede wszystkim uważane za czynnik napędzający procesy biznesowe przedsiębiorstwa, podczas gdy jeziora danych koncentrują się głównie na procesach związanych z uczeniem maszynowym.

Korzyści z centrum danych

Do tej pory rozumiemy, co to jest i jak działa. Wiemy również, jak ważne jest posiadanie tej platformy w całej organizacji. Oto kilka ważnych korzyści z wdrożenia centrum danych w całym przedsiębiorstwie.

Fundamentalną korzyścią z jej posiadania jest umożliwienie udostępniania danych. Odbywa się to poprzez połączenie twórców lub źródeł danych z użytkownikami lub konsumentami danych. Te punkty kontaktowe są również nazywane punktami końcowymi i wchodzą w interakcję z centrum danych, przesyłając do niego dane lub pobierając dane. Hub to skrzyżowanie, które zapewnia widoczność przepływu danych.

Kolejną korzyścią jest to, że zapewnia bezproblemową łączność w czasie rzeczywistym z różnymi systemami biznesowymi. Gwarantuje to rozwiązanie głównego wyzwania związanego z wymianą danych, zwłaszcza jeśli dane muszą być wymieniane w krótszym czasie reakcji.

Podsumowując, korzyści można ująć w cztery wiadra

  • Konsolidacja danych przechowywanych w silosach w ujednolicony system
  • Elastyczny i wydajny system do zarządzania przepływem pracy
  • Lepsza widoczność i łatwość dostępu do danych w całej organizacji
  • Zunifikowany system z ujednoliconym interfejsem

Przykłady technologii Data Hub

Jak wspomniano wcześniej, centrum danych to nie tylko technologia, ale raczej platforma i podejście przyjęte przez organizacje w celu scentralizowania widoku danych we wszystkich obszarach. Widzimy jednak wiele produktów, które są sprzedawane na rynku. Oto kilka przykładów, które są sprzedawane na rynku jako produkty technologiczne.

  • Reklamy Google
  • Cloudera, Przedsiębiorstwo
  • Kumulalność IoT

Dodatkowo widzimy również SAP jako kolejny przykład. Poniższy diagram daje wyobrażenie o strukturze centrum danych i interakcji centrum danych SAP z innymi systemami biznesowymi i technologiami.

Źródło: SAP(2)

Końcowe przemyślenia

Obecnie, ponieważ organizacje mają wiele jednostek operacyjnych, rozmieszczonych w różnych lokalizacjach geograficznych, ważne jest, aby kierownictwo scentralizowało dane, które pomogą im wyodrębnić je w razie potrzeby i podjąć świadomą decyzję. Posiadanie centrum danych to więcej platforma niż tylko struktura technologiczna.