Das Projektvorhaben umfasst die Konzeption und Implementierung einer Architektur mit dem Ziel, eine BI Platform auf Grundlage eines Data Lakes zu schaffen. Hierbei sind unterschiedliche Technologien in geeigneter Weise in die Gesamtarchitektur zu integrieren, so dass die Kundenanforderungen wie bspw. Echtzeitdatenanbindung, Integrationen semistrukturierter Daten, Langzeitdatenarchivierung und performantes Detaildatenreporting auf Massendaten Berücksichtigung finden.
Eine Kernaufgabe ist die Integration der unterschiedlichen Komponenten in die Systemarchitektur eines Enterprise Data Warehouses (EDWH): angefangen mit den Komponenten für die Anbindung von Quellsystemen wie bspw. HVR, Oracle Data Integrator (ODI) oder Teradata Listener über die Komponenten für die Datenhaltung wie Teradata und Hadoop bis hin zu den Accesskomponenten Teradata QueryGrid, SAP BusinessObjects Web Intelligence und Tableau.
Ein Schichtenmodell zur Abgrenzung unterschiedlicher Datenbereiche dient der Kapselung verschiedener Kernaufgaben wie Datenversionierung der Quellsysteme, Datenintegration in logische Business Objekte und Reporting unter Einhaltung der Data Privacy. Im Schichtenmodell ebenfalls verankert, ist die Trennung in isolierte Umgebungen für Entwicklung, Integration und Produktion als zentrale Vorgabe im Sinne der Continous Integration. Abschließend sind Standards und Konventionen zu definieren, die eine kontinuierliche Weiterentwicklung des EDWHs des Kundes ermöglichen.