Panorama in Deutschland

Panorama NovaView, jetzt in Deutschland.

 

Was ist OLAP?

Online-Analytical-Processing (OLAP) ist eine effektive Technologien zum Analysieren und Auswerten von Daten und zum Verdichten auf relevante Information. OLAP ist sozusagen der Motor von professioneller Business Intelligence. Es ist ein Sammelbegriff für Applikationen, Anwendungen und Methoden, die zum Sammeln, Verwalten, Bearbeiten und Darstellen von multidimensionalen Daten zu Analysezwecken dienen. Manchmal wird OLAP aber auch einfach als Synonym für ein multidimensionales Datawarehouse verwendet.

Durch den Einsatz operativer Systeme entsteht eine Vielzahl von digitalen Daten, die meist in OLTP-Systemen gehalten und aktualisiert werden. Die Analysefunktionen einer solchen Datenbank werden durch eine wachsende Datenmenge erschwert. Dann kommt OLAP-Technologie zum Zug. Mit dieser Technologie kann viel einfacher aus der Unmenge an Daten die relevante Information herausgefiltert werden.

Cells in OLAP cube.

Die Regeln von Codd


Im Jahr 1985 prägte der britische Mathematiker und Datenbanktheoretiker Edgar F. „Ted“ Codd den Begriff On-Line Transaction Processing (OLTP) und schlug zwölf Regeln für relationale Datenbanken vor. Seine Terminologie ist heute weit verbreitet und seine Regeln wurden als Standard für Datenbanken im operationalen Bereich (Transaktionen) akzeptiert und in Form der SQL-Abfragesprache von ANSI und ISO offiziell standardisiert. Damit hat Codd die Grundlagen für das relationale Datenmodell gelegt, auf dem heute alle RDBMS (Relational Database Management System) aufbauen.

Im Jahr 1993 erfand Codd den Begriff On-Line Analytical Processing (OLAP), quasi als Gegenentwurf zu OLTP. Wieder stellte er zwölf Regeln zur Definition einer OLAP Anwendung auf, die als Basisanforderung für ein OLAP-konformes Werkzeug gelten sollten. Die Funktionalitäten sollen dem Anwender in einer Art zur Verfügung gestellt werden, wie er sie von modernen Tabellenkalkulationsprogrammen her kennt.

1. Multidimensionale konzeptionelle Sichten: Ein Anwender muss Daten aus unterschiedlichen Dimensionen betrachten können, zum Beispiel nach Region, Zeit etc.

2. Transparenz: Ob die Funktionalität der mehrdimensionalen Analyse Teil des eigenen OLAP-Werkzeug ist, sollte für den Anwender verborgen bleiben.

3. Zugriffsmöglichkeiten auf Quellsysteme: Ein OLAP-Werkzeug muss eigene, konzeptionelle Schemata unterstützen, die den heterogenen Zugriff auf RDBMS und andere Datenquellen erlauben.

4. Konsistente Leistungsfähigkeit bei der Berichterstellung: Die Zeit, die für Anfragebearbeitung und Berichterstellung aufgewendet werden, darf nicht wesentlich dadurch beeinflusst werden, dass der Anwender die Anzahl der verwendeten Dimensionen erhöht.

5. Client-Server-Architektur: Server-Komponenten eines OLAP-Systems muss verschiedene Clients mit einem Minimum an Aufwand integrieren.

6. Generische Dimensionalität: Es darf nur eine logische Struktur für alle Dimensionen existieren.

7. Dynamische Behandlung einer wenig gefüllten Matrix: Überwiegend leere Felder einer Matrix müssen effizient behandelt werden.

8. Mehrbenutzer-Unterstützung: Konkurrierender Zugriff, Sicherheits- und Integritätsregeln sind zu unterstützen.

9. Uneingeschränkte, multidimensionale Operationen: Berechnungen und andere Aktivitäten zwischen beziehungsweise über Dimensionen hinweg dürfen nicht den Eingriff des Anwenders erfordern.

10. Intuitive Datenbearbeitung: Drill-down, Zoom-out und andere Bearbeitungsschritte (Slicing und Dicing) sollen dem Anwender ohne großen Aufwand die Darstellung der Daten aus anderen Sichten erlauben.

11. Flexible Berichterstellung: Der Anwender kann die Daten für die spätere Ausgabe frei gestalten.

12. Unbegrenzte Dimensions- und Aggregationsebenen: OLAP-Werkzeuge sollten eine unbegrenzte Anzahl an Dimensionen unterstützen. In der Praxis sind dies mindestens 15 besser 20.

Im Gegensatz zum Begriff OLAP selbst konnten sich die OLAP-Regeln von Codd nicht durchsetzen. Sie werden noch gern aufgeführt, aber ihre Bedeutung für die Bewertung eines OLAP-Systems kann heute als niedrig eingestuft werden. Dies liegt vor allem daran, dass sie sehr anwendungsbezogen und teilweise umstrittenen sind.

Cells with drilldown in OLAP cube.

OLAP versus OLTP

Der Begriff OLTP (Online Transaction Processing) ist typisch für die Informationsverarbeitung im Bereich operativer Systeme, die für die Abwicklung von Aktivitäten des Tagesgeschäfts eingesetzt werden. Die Funktionalität der Datenbank richtet sich in gleichem Maße auf Lese-, Update-, Schreib- und Löschzugriffe auf die Daten. Aktuelle Detailinformation werden in der Regel satzweise abgefragt.

In OLAP-Anwendungen werden aggregierte und historische Daten verwendet, wobei meist eine Vielzahl von Sätzen involviert sind. Diese Daten stammen ursprünglich aus einem OLTP-System und werden in periodischen Abständen in das OLAP-System geladen. Die Architektur einer OLAP Datenbank sieht komplexe, mehrschichtige Abfragen vor. Um die Idee von OLAP zu verstehen, ist es wichtig, die multidimensionelen Arten von heutigen Unternehmensdaten zu verstehen.

OLAP versus relationale Datenbank

OLAP ist auch ein Datenbankmodell, ebenso wie das relationale Datenmodell. Bei einem relationalem Datenmodell werden (zweidimensionale) Tabellen durch Relationen miteinander verknüpft. OLAP dagegen verknüpft mehrere Dimensionen miteinander. In OLAP-Datenbankabfragen (etwa MDX) können diese komplex kombiniert verwendet werden. Die Abfragesprache unterscheidet sich daher von einer Abfrage auf eine relationale Datenbank mittels SQL.

Drei Punkte, die im Vergleich zu einer relationalen Datenbank für den Einsatz eines OLAP-Tools sprechen:
- konsistent schnelle Antwortzeiten
- metadaten-basierte Abfragen
- tabellenartige Formeln

OLAP-Datenhaltung

Die Dimensionen stellen, virtuell oder physisch abgelegt, einen der Kernpunkte von OLAP dar. Die Multidimensionalität lässt sich rein physikalisch unterschiedlich realisieren. In der Praxis werden die Daten oft in relationalen Datenbanksystemen vorgehalten und dann dem Nutzer multidimensional präsentiert. Üblich sind aber auch multidimensionale Datenbanken oder Zusatzkomponenten für relationale Datenbanken.

Um den spezifischen Anforderungen an schnelle, dynamisch anspruchsvolle Analysen der multidimensionalen Daten gerecht zu werden, können folgende OLAP-Architekturtypen eingesetzt werden:
* ROLAP („Relationales OLAP“) nutzt eine standardisierte, relationale Datenbank, um die Daten physikalisch zu speichern. Aggregierte Daten werden in eigenen Tabellen vorgehalten.
* MOLAP („Multidimensionales OLAP“) nutzt einen Speichermechanismus, der speziell für die Aggregation, Speicherung und Abfrage von multidimensionalen Daten optimiert wurde.
* HOLAP („Hybrides OLAP“) ist eine hybride „Mischvariante“, die die Vorteile von ROLAP und MOLAP vereint.
* DOLAP („ D“ für Desktop) importiert die benötigten Daten lokal auf den Analyseclient, um eine lokale Analyse durchführen zu können.
* RAP (Real-Time Analytical Processing oder auch „Memory Based OLAP“) hält alle Daten im Arbeitsspeicher (RAM) berechnet alle Werte in Echtzeit.

OLAP Panorama NovaView