Jaka jest różnica między hurtownią danych federacyjnych i zdecentralizowanych?

9

Nie mogę znaleźć żadnych jasnych definicji ani wyjaśnień żadnego z nich. Oba wydają się zdecentralizowane. Wygląda na to, że w Federated DWH dane są dystrybuowane i nie są zintegrowane w jednym repozytorium i są dostępne z rozproszonych źródeł.

Podczas gdy w zdecentralizowanej implementacji DWH dane są zintegrowane w jednym centralnym repozytorium.

Proszę wyjaśnić różnicę między tymi dwiema implementacjami.

LifeH2O
źródło
svenvanleuken.com/…
Shiwangini Shishulkar

Odpowiedzi:

6

Zdecentralizowana hurtownia danych jest zasadniczo zbiorem hurtowni danych obsługiwanych przez poszczególne regiony lub jednostki biznesowe, ale udostępnianych centralnie. Mogą znajdować się na tym samym serwerze fizycznym, udostępniać narzędzia do raportowania lub być udostępniane w całej organizacji w inny sposób. Mogą również istnieć scentralizowane komponenty, takie jak zarządzanie danymi podstawowymi. Zwykle dzieje się tak, ponieważ scentralizowane hurtownie danych stają się nieporęczne poza określoną wielkością organizacji. Hurtownia danych musi reagować na zmiany, a jeśli nie będzie zbyt responsywna, poszczególne działy zaczną budować własne rozwiązania.

Widać to w bankach inwestycyjnych, w których tendencją jest tworzenie hurtowni danych w celu spełnienia określonych wymagań (np. Konkretnej inicjatywy regulacyjnej lub pewnego rodzaju sprawozdawczości finansowej), a nie budowanie scentralizowanego magazynu dla całej działalności. Firma wielkości dużego banku jest po prostu zbyt złożona, aby spełnić wymagania dotyczące w pełni scentralizowanego EDW w rozsądnym czasie.

Sfederowana hurtownia danych dodaje warstwę konsolidacji głównej w zdecentralizowanych hurtowniach danych. Zazwyczaj mieści się tam tylko wąski pionowy wycinek danych, ponieważ jego celem jest konsolidacja kluczowych wskaźników w całym przedsiębiorstwie na potrzeby raportowania na poziomie firmy lub grupy, a nie zapewnienie ogólnej platformy MI dla wszystkich działów. Działy mają pozostawić własne systemy EDW lub MI, ale są zobowiązane do dostarczenia zestawów danych potrzebnych do wypełnienia centralnej warstwy konsolidacyjnej.

Ta architektura zapewnia to, co najlepsze z obu światów. Centralne kierownictwo może zobaczyć swoje wskaźniki w całej organizacji, a działy mogą zorganizować rozwiązania MI w celu zaspokojenia ich potrzeb. Centralne kierownictwo musi jedynie nałożyć wymagania dotyczące danych wymagane przez ich analizy i MI jako źródła danych dostarczane przez systemy departamentalne. Jeśli potrzebują bardziej szczegółowych raportów lub analiz dotyczących określonego działu, mogą to zapewnić systemy działowe.

W poniższym artykule omówiono bardziej szczegółowo federacyjne hurtownie danych.

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

W tym artykule omówiono bardziej szczegółowo topologie hurtowni danych.

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2

ConcernedOfTunbridgeWells
źródło
Więc oba są zdecentralizowane, ale stowarzyszone integrują podzbiór (kluczowe wskaźniki) w jednym miejscu?
LifeH2O,
Tak. To jest poprawne. Pamiętaj, że te definicje są dość nieformalne, więc ludzie mogą ich używać inaczej. Nigdy nie miałem okazji zbudować żadnego z tych systemów, chociaż raz złożyłem propozycję architektury federacyjnej i widziałem kilka witryn, które miały systemy, które można scharakteryzować jako zdecentralizowane na podstawie używanych przeze mnie definicji.
ConcernedOfTunbridgeWells