Datenarchivierung in SAP: Gründe, Anforderungen und Leistungsmerkmale

In produktiven SAP-Systemen wächst das Datenvolumen permanent. Und mit wachsendem Datenbestand gewinnen auch Speicherung und Verwaltung dieser Daten zunehmend an Bedeutung, insbesondere aufgrund der steigenden Kosten für Administration und Hardware.

Gründe für die Datenarchivierung in SAP:

Für die Datenarchivierung gibt es ja nach Art der Daten systembedingte und gesetzliche Gründe. In allen Fällen sorgt die Datenarchivierung für:

  • Verringerten Speicherplatz und weniger Laufzeitprobleme durch das Datenwachstum
  • Langsamer verlaufendes Datenwachstum
  • Langfristig kontrollierbare und administrierbare Datenbank
  • Kostengünstige Einhaltung der gesetzlichen Vorgaben zur Datenaufbewahrung
  • Wiederverwendbarkeit der Daten

Ohne Datenarchivierung hingegen nehmen die Antwortzeiten im Dialogbetrieb zu während die Systemperformance sinkt. Hinzu kommen längere Ausfallzeiten bei Releasewechseln sowie Backup- und Recovery-Vorgängen. Datenbanken müssen daher in einem performanten Zustand gehalten werden.

Das Ziel:
Sicherstellung einer langfristig berechenbaren und kontrollierbaren Datenbankgröße, die sich positiv auf die Performance des SAP-Systems auswirkt. Zusätzlich senkt die Datenarchivierung die Kosten für Administration und Verwaltung der Datenbank.

Anforderungen an die Datenarchivierung in SAP:

Neben den Datenmengen machen vor allem die Komplexität der Verknüpfungen und Datenstrukturen innerhalb der jeweiligen Systemlandschaft die Archivierung im SAP-Umfeld zu einer besonderen Herausforderung. Eine Datenarchivierung muss schließlich mehr leisten als nur das reine Sichern von Tabelleninhalten.

Folgende Punkte müssen Sie bei der Datenarchivierung in SAP beachten:

Die Verschlüsselung der numerischen Felder ist hardwareabhängig. Bei der Archivierung müssen also Informationen über die verwendete Hardware den zu archivierenden Daten beigefügt werden.
Die Datenstruktur kann vom Release der verwendeten SAP-Business-Suite abhängen. Informationen über Satzaufbauten und Felddefinitionen müssen mitarchiviert werden.
Ein Großteil der Datenobjekte ist nur in Verbindung mit anderen Datenobjekten sinnvoll bzw. von diesen abhängig. Bei der Archivierung ist also zu prüfen, ob die Archivierung eines Datenobjektes die Archivierung anderer Objekte voraussetzt ober ob andere Objekte parallel zu archivieren sind.
Bei der Archivierung muss darauf geachtet werden, dass Angaben über die organisatorische Struktur des Unternehmens mitarchiviert werden. Denn nur in Verbindung mit diesen Daten sind manche Daten auch interpretierbar
 

Hier wird deutlich, dass die Datenarchivierung in SAP häufig auch eine sehr genaue Kenntnis der Semantik der Daten erfordert. Aus diesen Gründen ist der anwendungsintegrierte Ansatz der SAP-Datenarchivierung gegenüber Produkten, die nicht in eine SAP-Business-Suite-Lösung eingebunden sind, z.B.datenbankbasiertes Archivieren, überlegen.

Leistungsmerkmale der Datenarchivierung in SAP:

  • Schreiben der Daten in die Archivdatei und Löschen der Daten aus der Datenbank sind getrennte Vorgänge: der Archivierungsvorgang ist bei Übertragungsfehlern erneut aufsetzbar
  • Daten sind erst nach der erfolgreichen Archivierung löschbar o Vor dem Löschen der archivierten Daten können die Archivdateien in einer externen Ablage abgelegt werden (maximale Datensicherheit)

  • Tertiärspeichermedien (z. B. WORMs): Ablage erfolgt automatisch/manuell über die Content Management Infrastructure (ArchiveLink/CMS-Schnittstelle).
  • Hierarchische Speichermanagementsysteme (HSM) im jeweiligen Dateisystem: automatische Verwaltung der Archivdateien durch das HSM-System. Zum Speichern der Archivdateien können ebenfalls Tertiärspeichermedien verwendet werden

Automatische Komprimierung bis zum Faktor 5. Sind Daten in Cluster-Tabellen gespeichert findet keine weitere Komprimierung statt
Möglichkeit der Archivierung ohne vorherige Datensicherung während des normalen Systembetriebs. SAP empfiehlt jedoch, Archivdateien vor der Ablage zu sichern.

  • (lesender) Zugriff auf einzelnes Datenobjekt (z.B. Buchungsbeleg)
  • Auswertung der Archivdatei
  • Zurückladen in Datenbank, wenn für Archivierungsobjekt vorgesehen

Durch Hard- oder Softwarewechsel bedingte Konvertierungen der Archivdateien nimmt das SAP-System beim Lesen der Datei automatisch vor.
Die Zurückgewinnung von Speicherplatz steigert die Performance der Anwendungsprogramme. Sie benötigen Informationen über den Speicherbedarf der zu archivierenden Daten in der Datenbank und der erzeugten Archivdateien.

Verschiedene Möglichkeiten der Datenarchivierung in SAP

1. SAP Content Server und klassische externe Archivsysteme

Bisher wurden meist 2 Optionen bei der Datenverwaltung im SAP-Kontext genutzt, der SAP Content Server als SAP-eigenes Produkt und/oder ein externes Archivsystem:

Der Einsatz des SAP Content-Servers

Der SAP-Content Server ist als SAP-eigenes Produkt kostenlos. Dieser Server legt die Dokumente auf einer separaten Instanz neben SAP ab und verwaltet diese ähnlich wie ein Content Adressed Storage (CAS)-System. Die Daten können entweder auf einer SAP DB auf dem Content Server oder einem externen Filesystem gehalten werden.

Allerdings ist diese Methode für die rechtssichere Verwaltung großer Dokumentenmengen im produktiven Betrieb nicht geeignet.

Deshalb hat sich die Mehrheit der SAP-Anwender für die Anbindung von ECM-Systemen zur Archivierung entschieden.

Die Verwendung klassischer externer Archivsysteme wie DMS, ECM

Klassische Archivsysteme, DMS oder ECM wurden ursprünglich über den SAP-Kontext hinaus für die Archivierung beliebiger prozessbezogener Dokumente konzipiert.

Diese Systeme umfassen umfangreiche Komponenten zur Ablageverwaltung, stellen sich gegenüber dem SAP-System jedoch als „Black Box“ dar. Da SAP aber die fachliche Verwaltung des Contents übernimmt, muss eine Möglichkeit geschaffen werden, um den abgelegten Dokumenten Attribute aus dem SAP-System mitzugeben. Nur so können die archivierten Daten im externen Archivsystem fachlich richtig zugeordnet und recherchiert werden.

Zwischenfazit:

Eine Gemeinsamkeit haben die beiden Ansätze: Die Ablage von Content erfolgt immer über die Schnittstelle ArchiveLink.

Der Nachteil: es werden keinerlei Attribute mitgegeben. Das heißt, der Content ist intransparent, eine sprechende Datei- oder Datenbankstruktur fehlt.

Über die SAP-Standardschnittstelle können Daten schnell und einfach archiviert werden. Allerdings sind die Fragen des Zugriffs und der Metadatenverwaltung hier kritisch. Das Archiv muss die für die Recherche notwenigen Metadaten kennen, das SAP-System hingegen beansprucht sowohl die Metadatenverwaltung als auch das Berechtigungsthema für sich. Es kommt zu Konflikten.

Klassische Archiv-, DMS- und ECM-Systeme lassen sich also nur dann optimal nutzen, wenn die dort integrierte Metadatenverwaltung und Berechtigungslogik sowie der eigene Client genutzt werden. Gerade aber im Hinblick auf die Weiterentwicklung der Speichertechnologien verlieren Drittsysteme wie der SAP Content Server und ECM-Systeme zunehmend an Bedeutung.

2. Neue Methoden der Datenarchivierung in SAP: Hierarchisches Speicher-Management (HSM)

Anders als die beiden bereits beschriebenen Archivierungsansätze mit Drittsystemen benötigt man bei der Verwendung von HSM-Systemen nur noch eine Middleware zwischen HSM und SAP.

Archivsysteme nutzen optische und magneto-optische-Speichermedien. Für diese gab es bisher jedoch keinen allgemeingültigen Treiber. Jedes Archivsystem implementierte deshalb seinen eigenen Treiber, Medien wurden in eigenen Formaten und Ablagelogiken beschrieben.

Moderne HSM-Systeme hingegen sind losgelöst von der Zentraleinheit Server- oder Archivsystem und fungieren als eigene Infrastrukturkomponente.

Die Vorteile:
Eine standardisierte File-System-Schnittstelle wird bereitgestellt und sowohl Replikationsszenarien als auch Datenmigrationen sind möglich. Gleichzeitig wird auf die HMS-Systeme nur von SAP als führende Anwendung zugegriffen. Sowohl die Berechtigungssteuerung als auch die Verwaltung der Metadaten für die Suche werden über SAP verwaltet.

Jedes System leistet also nur das, wofür es auch bestimmt ist.

Das HMS-System bedient sich also bei der Datenarchivierung beim SAP-System in Bezug auf:

  • die Unterstützung der standardisierten Schnittstelle ArchiveLink
  • die performante Verwaltung der zur Ablage und zum Zugriff notwendigen Metadaten
  • die optimierte Ansprache der für die Speicherung genutzten Speichersysteme

Archivsysteme für SAP brauchen somit nur eine vereinfachte Architektur. Denn für das SAP-System ist ein Archiv nur ein externer Datenspeicher:

  • Zugriff auf die archivierten Daten findet über einen Primärschlüssel statt
  • Metadaten für die Suche werden in SAP verwaltet
  • Berechtigungssystem aus SAP
  • Nur SAP-abhängiger Datenzugriff
  • Archivsystem ohne eigene Logik

Das heißt, die Middleware konzentriert sich nur noch auf die optimierte Verwaltung der technischen Metadaten wie Archivdatum und Aufbewahrungszeit. Fachliche Metadaten werden dem SAP-System überlassen. Die Speicherung und Verwaltung findet im HMS-System statt.

Die Vorteile für den SAP-Anwender:

  • Bessere Ausnutzung vorhandener Speichersysteme
  • Sinkende Komplexität der Anwendungen
  • Schlankere Archive, weniger benötigte Ressourcen
  • Zusätzliche Datenbank zur Ablage der Metadaten entfällt
  • Verbesserte Zugriffsgeschwindigkeiten

3. Ergebnis:

Für bestimmte Dokumentenarten ist eine rechtssichere Archivierung gesetzlich vorgeschrieben. Daher ist die neue Lösung zur Datenarchivierung für alle Unternehmen interessant, unabhängig von der Größe.

Entscheidend ist dagegen die SAP-Durchdringung im Unternehmen: wird das SAP-System flächendeckend eingesetzt, sind meistens bereits HMS-Strukturen etabliert – der neue Archivansatz ist in diesem Fall besonders interessant.

Bei diesem Ansatz finden die Dokumentenanzeige und die Verwaltung der fachlichen Metadaten komplett über SAP statt, während Speicherung und Medienverwaltung einem hierfür optimierten Hierarchischen Speicher-Management-System übertragen werden.

Zur Umsetzung der Datenarchivierung in SAP

Für die mit Hilfe des SAP Datenarchivierung erzeugten Archivdateien kommen für die Ablage verschiedene Möglichkeiten in Betracht:

1. Ablagesysteme

Ist ein Ablagesystem an die SAP Business Suite angeschlossen, wird dieses am Ende eines erfolgreichen Schreiblaufs mit der Ablage der Archivdateien beauftragt.
Ist die automatische Ablage nicht erwünscht, können Archivdateien auch nachträglich manuell abgelegt werden.

Grundsätzlich aber erfolgt die Ablage über die Content Management Infrastructure und beinhaltet auch die ArchiveLink- bzw. CMS-Schnittstelle.

2. HSM-Systeme

Ist ein HSM-System im Einsatz, muss im Customizing nur der Dateipfad entsprechend gepflegt sein.

Die Kommunikation mit dem Ablagesystem über die SAP Content Management ist nicht nötig. Das Auslagern der Dateien auf ein passendes Speichermedium, je nach Zugriffshäufigkeit und Speicherplatzbelegung wird dem HSM-System überlassen.

 3. Vorhandene Speichermedien

Nach der Bearbeitung der jeweiligen Archivdatei durch das Löschprogramm, kann diese auch manuell auf vorhandene Speichermedien übertragen werden, z.B. durch Kopieren.