Ce este un Data Hub? – Un ghid complet

Publicat: 2021-08-20

Ecosistemul din jurul datelor este un univers vast. Este atât de divers încât, pentru ca orice organizație să aibă sens din ceea ce este disponibil, ar necesita implementarea unor sisteme de gestionare, monitorizare, analiză și interpretare a datelor. Pentru întreprinderile de astăzi, datele reprezintă un combustibil major care propulsează toate luarea deciziilor în cadrul organizației. Cu toate acestea, chiar și cu această criticitate, vedem că datele au fost stocate în sisteme izolate, ceea ce face dificilă analizarea datelor de către organizație. Unele dintre aceste date sunt stocate în depozite de date sau în hub-uri de date, iar unele se pierd în ceea ce se numește lacuri de date.

În acest articol
  • Definiți centrul de date
  • Cum functioneazã?
  • De ce Data Hub?
  • Tipuri de cunoscut
  • Diferența dintre Data Hub și Data Lake
  • Beneficiile
  • Exemple pentru tehnologiile Data Hub

Ce este data hub?

Un hub de date este un sistem modern de stocare a datelor care ajută organizațiile să consolideze și să stocheze date la nivel de întreprindere. De asemenea, permite companiilor să introducă date în alte sisteme, cum ar fi sistemele de business intelligence sau motoarele AI pentru analize ulterioare. Acele întreprinderi care doresc să opereze date în silozuri ar trebui să înțeleagă că deținerea de date le va simplifica complet procesul de gestionare a datelor și va fluidiza fluxul de date în întreaga întreprindere.

Există mai multe tehnologii, cum ar fi depozitarea datelor, știința datelor și ingineria datelor, care culminează într-o arhitectură de hub de date. Mai mult decât o tehnologie, poate fi considerată o metodologie pentru a asigura eficiența în gestionarea datelor și a modului în care datele pot fi stocate, pentru a ajuta organizațiile să proceseze în continuare.

Cum funcționează Data Hub?

Odată implementat, fiecare utilizator sau partener de livrare sau operator trebuie să execute un acord de utilizare care le dă permisiunea de a transfera datele în siguranță în depozitul hub de date. Acest lucru este pentru a asigura confidențialitatea datelor la care au acces utilizatorii. Transferul datelor are loc printr-o metodologie de integrare sigură și recunoscută.

Datele colectate sunt disponibile la nivel central și sunt standardizate pentru uniformitate. Ulterior, vor exista o serie de analize ale datelor colectate pentru a oferi informații semnificative, în departamente, unități operaționale și alte sectoare. În cele din urmă, datele sunt împinse înapoi către sistemele respective pentru un consum suplimentar. Acest lucru este explicat într-o diagramă simplificată, așa cum este menționat mai jos

Sursa diagramei: Dataversity(1)

De ce Data Hub?

Un motiv major pentru care orice organizație are nevoie de un hub de date este să conecteze toate punctele de contact de date și să facă datele disponibile într-o locație centrală - numită din punct de vedere tehnic ca integrare a datelor . La un nivel fundamental, oferă capabilități de abonament. Cu toate acestea, atunci când îl implementați eficient, există mulți alți factori, ceea ce îl face un cadru de bază pentru întreprinderi.

  • Securitate

    Majoritatea companiilor impun măsuri de securitate prin definirea controalelor de acces pentru cine poate accesa ce fel de date. De exemplu, companiile nu doresc să ofere acces la datele financiare și de resurse umane unui anumit set de angajați sau probabil că datele clienților ar trebui să fie limitate doar la echipele de vânzări și finanțe. Având-o, se va asigura că ierarhia organizației dumneavoastră este bine definită, punctele de acces la date sunt bine clasificate și controalele sunt puse în aplicare.

  • Cost-Eficient

    Imaginați-vă că aveți mai multe sisteme și că ați integrat cumva aceste sisteme, dar nu este perfect. Există deja o investiție pe care ați făcut-o pentru a avea aceste sisteme individuale și ați investit în continuare în integrarea acestor sisteme independente. Totuși, din moment ce nu a fost dovada completă, există încă provocarea de a nu avea vizibilitate. Într-o perioadă, această investiție devine o cheltuială operațională uriașă. Dacă îl implementați, scăpați de punctele de contact nedorite de integrare și aveți o singură integrare punct la punct, făcând proiectul general mai rentabil.

  • Agil

    Implementarea unui hub de date face ca întregul cadru să fie agil. Accelerează integrarea altor sisteme de afaceri, iar fluxul de date devine rapid și fără probleme. În absența acestuia, va exista și un scenariu în care sistemele vor încerca să preia sau să apeleze date de la alte sisteme. Apoi, există crearea de puncte de contact și interfețe de integrare, adăugând săptămâni și săptămâni de timp de implementare. Având-o, se asigură că toate datele sunt disponibile într-o locație centrală printr-un set de API-uri, politici de acces și un proces de abonare bine definit.

Tipuri de hub de date

În această secțiune, vom analiza diferitele tipuri și care sunt diferitele tipuri de puncte de contact finale

  1. Master Data Hub: În acest tip, punctele finale sunt de obicei sisteme operaționale. Datele sunt create fie în hub, fie la punctul final
  2. Hub de date aplicației: iar aici punctul final de date este un sistem operațional. Diferența este în crearea datelor deoarece, în acest tip, datele sunt create în hub și nu la punctul final.
  3. Integrare Data Hub: în acest tip, crearea datelor are loc la punctele finale. Aceste puncte finale pot fi de diferite tipuri, cum ar fi sisteme operaționale, instrumente sau motoare analitice sau orice entitate externă.
  4. Hub de date de referință: în acest tip, datele sunt create și stocate fie în hub, fie la sfârșit, în funcție de scenariul de afaceri. Și aici, punctele finale sunt similare cu hub-urile de date de integrare, cum ar fi sisteme operaționale, instrumente sau motoare analitice sau orice entitate externă.
  5. Hub de date analitice: huburile de date analitice stochează sau creează date numai pe punctele finale, care sunt sisteme operaționale.

Data Hub vs Data Lake

Dacă ne uităm la depozitele de date, lacurile de date și hub-urile de date, oamenii spun că sunt interschimbabile. Cu toate acestea, ele sunt diferite în anumite privințe și de obicei se completează reciproc. Să ne uităm la o comparație între hub-ul de date și lacul de date.

Hub de date Data Lake
Utilizarea primară este în jurul proceselor operaționale. Lacul de date este folosit în principal pentru analiză, învățare automată și raportare.
De obicei, este un set de date structurat. Datele similare pot fi structurate și nestructurate.
Proces de guvernanță strict pentru aplicarea regulilor. Nu există o guvernare strictă pentru aplicarea regulilor de accesare a lacurilor de date.
Calitatea datelor gestionate în hub-ul de date este extrem de ridicată. Calitatea datelor stocate și gestionate într-un lac de date este de calitate medie sau scăzută.
Oferă integrare în timp real cu flux bidirecțional de date de la/la alte sisteme. Fluxul de date este complet unidirecțional, care este de obicei ETL sau ELT în loturi.

Pe lângă diferențele menționate mai sus, hub-ul de date este considerat în primul rând un motor al proceselor de afaceri ale întreprinderilor, în timp ce lacurile de date sunt concentrate în principal pe procesele din jurul învățării automate.

Beneficiile unui hub de date

Până acum am înțeles ce este și cum funcționează. Știm, de asemenea, importanța acestei platforme în cadrul unei organizații. Iată câteva beneficii importante ale implementării unui hub de date într-o întreprindere.

Un avantaj fundamental al deținerii acestuia este acela de a permite partajarea datelor. Acest lucru se realizează prin conectarea creatorilor sau surselor de date și utilizatorilor sau consumatorilor de date. Aceste puncte de contact sunt cunoscute și sub denumirea de puncte finale și interacționează cu Data Hub împingând date în el sau preluând date. Hub-ul este o joncțiune, care oferă vizibilitate fluxului de date.

Un alt beneficiu este că stabilește conectivitate fără întreruperi și în timp real a diferitelor sisteme de afaceri. Acest lucru asigură că este abordată o provocare majoră în ceea ce privește schimbul de date, în special dacă datele trebuie schimbate într-un timp de răspuns mai rapid.

Pentru a rezuma, beneficiile pot fi puse în patru găleți

  • Consolidarea datelor stocate în silozuri într-un sistem unificat
  • Sistem flexibil și de înaltă performanță pentru gestionarea fluxului de lucru
  • Vizibilitate mai bună și acces ușor la date în întreaga organizație
  • Un sistem unificat cu o interfață unificată

Exemple pentru tehnologiile Data Hub

După cum am menționat mai devreme, un hub de date nu este doar o tehnologie, ci mai mult o platformă și o abordare adoptată de organizații pentru a centraliza vizualizarea datelor la nivel global. Cu toate acestea, vedem multe produse care sunt vândute pe piață. Iată câteva exemple care sunt vândute ca produse tehnologice pe piață.

  • Google Ads
  • Cloudera, Enterprise
  • Cumulocity IoT

În plus, vedem și SAP ca un alt exemplu. Diagrama de mai jos oferă o idee despre structura hub-ului de date și interacțiunea hub-ului de date SAP cu alte sisteme și tehnologii de afaceri.

Sursa: SAP(2)

Gânduri finale

Astăzi, din moment ce organizațiile au mai multe unități de operare, răspândite în diferite locații geografice, este important ca managementul să centralizeze datele care le vor ajuta să extragă atunci când este necesar, pentru a lua o decizie informată. A avea un hub de date este mai mult o platformă decât un simplu cadru tehnologic.