Was ist ein Data Warehouse? Ein Großteil dieser Frage konnte bereits in den letzten Beiträgen beantwortet werden.
Dieser Teil dreht sich um ein wichtiges Teil-System eines Data Warehouse: dem Data Mart.
Hier gehts zu den vorherigen Teilen: Teil 1, Teil 2 und Teil 3.

Eine weitere Möglichkeit der Analyse besteht in der Nutzung von OLAP-Abfragen. Dieses Akronym steht für „Online Analytical Processing“ und beschreibt die interaktive Analyse eines vorher definierten Datenwürfels. Diese Art der Analyse kommt ausschließlich bei der Konstruktion von Data Marts zum Einsatz, da der Aufbau abhängig von den jeweiligen Anforderungen ist. Ein DWH ist für das gesamte Unternehmen gültig, und somit nicht optimiert für jedwede spezialisierte Anfrage[1]. Da Data Marts für schnelle Analysen genutzt werden sollen, muss beim Design des Datenbankmodells ein entsprechend effizientes Schema gewählt werden, welches diese schnellen Zugriffe und Anfragen auch bei großen Datenmengen gewährleisten kann. Diese Geschwindigkeit wird erreicht, in dem möglichst wenige Join-Operationen durchgeführt werden müssen. Deswegen hat sich das Star-Schema, zu sehen in Abbildung 2, als ein gutes Design herausgestellt. Es gibt eine Faktentabelle in der Mitte und eine beliebige Anzahl an Dimensionstabellen außen herum. Um diese Effizienz sicherzustellen, sollte die Faktentabelle den Großteil aller Tupel des zu untersuchenden Ausschnitts beinhalten. Um bei dem Beispiel von [2] zu bleiben: Als Faktentabelle können die Bestellungen dienen, da dort die meisten Einträge vorhanden sind. Mögliche Dimensionstabellen sind der Kunde oder das Produkt, welche beide als Fremdschlüssel in der Tabelle der Bestellungen vorhanden sind. Das zweite Konzept in Abbildung 2 beschreibt das Snowflake-Schema, welches den gleichen Ansatz wie das Star-Schema verfolgt. Es erweitert dieses um die Möglichkeit, die Dimensionstabellen weiter aufzuteilen. Dies soll geschehen, um das Schema zu normalisieren und somit Redundanzen zu eliminieren und Platz einzusparen, wobei dies aber gleichzeitig die nötigen Operationen bei Anfragen erhöht. Siehe auch [3].
Nun sind die Grundlagen und die technischen Hintergründe geklärt. Weiter in Teil 5 geht es mit dem praktischen Nutzen.
Quelle der Abbildung: https://techdifferences.com/difference-between-star-and-snowflake-schema.html
[1] Laut Inmon, W. H., Strauss, D., & Neushloss, G. (2008). DW 2.0. Burlington, USA: Elsevier Inc. S. 18f existiert ein Ansatz, das komplette DWH so zu konstruieren, welches aber entscheidende Nachteile mit sich bringt.
[2] Inmon, W. (2005). Building the Data Warehouse. Indianapolis, Indiana: Wiley Publishing, Inc.
[3] Bonifati, A., Fuggetta, A., & Cattaneo, F. (Oktober 2001). Designing Data Marts for Data Warehouses. ACM Transactions on Software Engineering and Methodology, S. 452-483.