SAP HANA, kurz für High-Performance Analytics Appliance, ist die neue Datenbankgeneration von SAP. Sie ist besonders geeignet, sehr große Datenmengen in kürzester Zeit zu verarbeiten. Auswertungen oder MRP-Läufe, die mit gängigen Datenback-Technologien mehrere Stunden dauern können, lassen sich mit SAP HANA in Minuten abschließen. Aber SAP HANA ist aber mehr als nur eine In-Memory Datenbank. Man spricht vielmehr von einer kompletten Anwendungsumgebung. Diese soll in Zukunft bei allen SAP-Produkten zum Einsatz kommen.  Die SAP HANA Cloud Plattform kann in drei Segmente unterteilt werden:

  • SAP HANA App Services
  • SAP HANA DB Services
  • SAP HANA Infrastructure Service

SAP HANA Cloud Platform

Die 3 Segmente auf einen Blick

Der SAP HANA Infrastructure Service bietet eine Infrastruktur im Rahmen eines Abonnements mit periodischer Zahlung. Das Abonnement beinhaltet neben einer Lizenz, komplette Hardware zur sofortigen Nutzung von SAP HANA.

SAP HANA App Services stellt Cloud Anwendungen zur Verfügung. Zusätzlich wird eine Entwicklungsumgebung geschaffen, um eigene Anwendungen erstellen zu können.

Die SAP HANA Datenbank bietet sofortige Verfügbarkeit von Abfragen um eine Entscheidungsfindung zu beschleunigen. Sie bietet ein flexibles Datenmodel mit integrierten Grafik-Anwendungen, um spezifische Anforderungen von Geschäftsanwendungen darstellen zu können.

Außerdem ist sie die Basis der SAP HANA Appliance, die die Bewegung von SAP und Nicht-SAP-Daten zulässt und dadurch die Integration in das HANA-System ermöglicht.

Hauptcharakteristika der SAP HANA Datenbank

SAP HANA DB bietet einen SQL-basierten Zugriff auf rational strukturierte Daten, um volle Transaktionsunterstützung gewährleisten zu können.

Immer mehr Anwendungen erfahren die Ausrichtung von klassisch strukturierten, semi-strukturierten und unstrukturierten Daten sowie Textdaten. Mit so genannten „joining“ werden semi-strukturierte und klassische Daten verbunden.

Der Hauptunterschied zwischen einer klassischen Datenbank und der SAP HANA DB besteht aus der Integration der Logik der Business Anwendungen. Womit die HANA DB mit semantischen Modellen ergänzt wird.
SAP HANA DB arbeitet mit paralleler Datenverarbeitung, d.h. Anwendungen und Algorithmen laufen nebeneinander.
Die Datenbank interagiert mit den jeweiligen Anwendungen (shared memory communication).

Außerdem existiert eine SAP-HANA-Datenbank-Cluster Infrastruktur, um verschachtelte Anwendungslogiken effizient ausführen zu können.

 

Die Komponenten der SAP HANA Datenbank im Detail

 

sap_hana_datenbank_detail

 

Der Transaction Monitor koordiniert, kontrolliert, überwacht und tracked alle Datenbank Transaktionen.

Als Concurrency Control verwendet die SAP HANA Datenbank das MVCC Prinzip. Dies ist ein Verfahren der Datenbanktechnik, das konkurrierende Zugriffe auf die Datenbank möglichst effizient koordiniert.

Die Optimizer and Plan Generator ruft die verschiedenen in-Memory Engines auf.

Als Repräsentation von Berechnungen der Calculator Engine dient das Calculator Model.

Der Authorization Manager überprüft, ob die Clients über die benötigten Rechte verfügen, um bestimmte Operationen auf der Datenbank ausführen zu können.

Die Definition von Tabellen, Views und Indices erfolgt über den Metadata Manager.

Der Persistancy Layer verwaltet Daten, die auf allen drei Engines verteilt sind. Er besteht aus der MAX DB und der „commercialized disk-centric relational DB“.

 

Die SAP HANA DB verfügt über drei verschiedene in-Memory Storage Engines

 

Diese Engine verfügt über eine Zeilen- und Spaltenorientierte Analyse. Beispielsweise werden User- oder Anwendungsdaten in Spalten gespeichert, um hohe Performance zu erreichen. Metadaten oder Daten, auf die nur selten zugegriffen wird, werden in Zeilen gespeichert. Zudem kombiniert sie SAP P*time, einer OLTP Datenbank, und SAP TREX, welche schon in SAP BWA (Business Warehouse Accelerator) verwendet wurde um BI (Business Intelligence) Datenbankabfragen zu beschleunigen.
Die Graph Engine wird für die Repräsentation komplexer Datenbankverbindungen benötigt und dient der optimalen Unterstützung von Ressource Planning Anwendungen, wie Data Warehouse Szenarios.
Die Text Engine verfügt vor allem über bestimmte Suchfähigkeiten, wie der Suche nach Wörtern, Phrasen oder beispielsweise der „Fuzzy Search“ (unscharfe Suche).