Návrh metodiky implementace Datawarehouse – Diplomová práce

Vymezení tématu práce a důvod výběru tématu

Tato diplomová práce se zaměřuje na problematiku implementace Data Warehouse od jejích počátků, tj. od celkového pojetí datového skladu ve firmě, problematiku modelování žádoucího stavu datového skladu, pokračujíce poté samotnými počátky před zahájením implementace a konče návrhem vlastní metodiky uplatitelné při implementaci Data Warehouse, nezávislé na tržním prostředí firmy, kde bude tento Data Warehouse zaváděn.

Důvodem pro zvolení tématu návrhu metodiky implementace DW je můj vysoký zájem o problematiku integrované správy dat a jejich využití jako celku, zvláště pak o oblast přípravy tvorby relačně databázových skladů, jejich následné implementace a převedení takto nově vzniklého systému do praxe. V posledních pár letech jsem měl možnost pracovat ve společnosti, která se poté, co na neexistenci jakéhokoliv jednotného datového úložiště začala pomalu doplácet ve smyslu existence redundance a duplicity dat a nadále neudržitelné datové základny, rozhodla Data Warehouse zavést. Celá diplomová práce je pojata jako prostředek umožňující mi hlouběji pochopit problematiku DW a správy dat a současně nabízí popsanou nově vzniklou metodiku implementace Data Warehouse, která vznikla na základě nových poznatků otestovaných při řešení konkrétního projektu v praxi.


Struktura práce

V úvodu své diplomové práce se soustřeďuji na otázku, jaký význam má existence Data Warehouse ve firmě, co jí vybudování centrálního skladu dat přinese a jaké jsou základní přístupy k Data Warehouse.

Poté pokračuji samotnými počátečními kroky, kterými by měla firma, po rozhodnutí implementovat DW, pokračovat, a to fází modelování (zcela přeskočím fázi globální a detailní analýzy současného stavu podniku – tato část je kvalitně popsána v [REP1] ). Zaměřuji se zde nejen na využití ERD diagramů ve fázi modelování žádoucího stavu datového skladu, ale i techniku UML pro objektový přístup k datům (z čehož bude na závěr vycházet i návrh mé metodiky), aspekty kvality při modelování podnikových procesů a na základní charakteristiky, které by kvalitní datový model měl obsahovat.


V další kapitole se již soustředím na návrh DW, který bude vycházet z koncepce jednotného integrovaného normalizovaného úložiště dat, ze kterého budou tvořena jednotlivá datová tržiště. Půjde tedy o takový Data Warehouse, který slouží primárně jako jednotné úložiště dat, kdy tato data jsou v systému uložena vždy pouze a právě jednou (nepůjde tedy o dimenzionální DW). Kapitola v sobě zahrnuje problematiku lidských zdrojů při implementaci Data Warehouse, otázku datových modelů, externích a nestrukturovaných dat, problematiku času, rozložených datových skladů, ad.

Praktická pátá kapitola, týkající se návrhu vlastní metodiky při tvorbě Data Warehouse, je zahájena pojetím celé implementace DW jako projektu, poté pokračuji základní myšlenkou objektového přístupu k relačně objektovým datům a následně vysvětluji funkci datového modelování jako důležitého výchozího bodu při implementaci DW. Po vybudování DW sáhne v mnoha případech management firmy i po vybudování operativního datového skladu (ODS). V rámci návrhu své metodiky se pokouším vysvětlit, proč by mělo být o jeho vybudování uvažováno ještě před existencí DW a jaký přínos to může přinést.

Další částí závěrečné kapitoly je, na základě všech předchozích bodů, samotná fyzická implementace DW včetně určení strategie zálohování, řízení optimalizace výkonu, testovací fáze, aj. Vše je zakončeno procesním modelem integrace nových dat do existujícího DW, využitím XML a problematikou řízení přístupových práv.

Vzhledem k možnosti realizace navržené metodiky implementace DW v praxi jsem měl šanci poznat určitá slabá místa, která vznikla díky chybám většinou z přecenění lidských možností. Analýzou těchto slabých míst se zabývá šestá kapitola diplomové práce, která je založena na shrnutí dosavadních poznatků a jejich konfrontace s praxí.

Celou diplomovou práci si můžete stáhnout ve formátu PDF

Bookmarking:
  • del.icio.us
  • Facebook
  • Linkuj.cz!
  • Google Bookmarks
  • Jaggni to!
  • Bookmarky.cz
  • Twitter
  • Add to favorites
  • LinkedIn
  • TOPodkazy.cz
  • Top Články.cz

Leave a Comment

Please note: Comment moderation is enabled and may delay your comment. There is no need to resubmit your comment.