Artikel teilen

group24 Newsletter

Nichts mehr verpassen

Als Abonnent unseres Newsletters sind Sie immer einen Schritt voraus und erhalten als Erster exklusive Informationen. Erfahren Sie mehr über attraktive Rabattaktionen, informieren Sie sich über das Neueste aus der IT-Welt und erfahren Sie Aktuelles zu unseren Services.

Newsletter abonnieren
Avatar photo
Andreas Heit
Security Consultant 12 Min 07.04.2025 Aktualisiert: 08.04.2025

Was ist Disaster Recovery und warum ist es unverzichtbar?

Könnte Dein Unternehmen morgen noch weiterarbeiten, wenn heute ein schwerer IT-Ausfall eintritt? Für den Ernstfall richtig vorsorgen: Disaster Recovery. Unvorhersehbare Ereignisse („Desaster“ wie z. B. Cyberangriffe, Systemausfälle oder Naturkatastrophen) können den Geschäftsbetrieb erheblich beeinträchtigen. Die gute Nachricht: Ein Disaster-Recovery-Plan (DRP) stellt sicher, dass wir für unsere IT-Systeme und Daten Vorsorge treffen, um diese schnell und geordnet wiederherzustellen.

In diesem Beitrag erfährst Du, was Disaster Recovery wirklich bedeutet, warum es weit mehr ist als nur ein Backup – und wie Du Schritt für Schritt einen wirksamen DR-Plan aufbaust, der Deine IT und Deine Geschäftsprozesse im Ernstfall retten kann.

Was versteht man unter Disaster Recovery?

Disaster Recovery (DR) umfasst gezielte Maßnahmen zur Wiederherstellung von IT-Systemen und geschäftskritischen Funktionen nach einem schwerwiegenden Vorfall. Im Mittelpunkt steht die Reaktion auf geschäftsgefährdende Ereignisse wie Cyber-Angriffe, Hardware-Ausfälle oder Naturkatastrophen. Ein effektiver DR-Plan definiert konkrete Wiederherstellungsstrategien, um den Geschäftsbetrieb schnellstmöglich wiederherzustellen und den wirtschaftlichen Schaden zu minimieren. Dies geschieht bereits auf der Ebene eines IT-Notfallkonzepts – wichtige Bestandteile sind hier die Notfallorganisation, sichere und verfügbare Notfallarbeitsplätze. Wiederherstellungspläne von Geschäftsprozessen, technische Wiederherstellungspläne sowie ein Test- und Verbesserungsprozess.

Bestandteile eines IT-Notfallkonzepts

Ein IT-Notfallkonzept legt fest, wie auf schwerwiegende Störungen reagiert wird – technisch, organisatorisch und prozessual. Damit die Maßnahmen im Ernstfall nicht nur auf dem Papier existieren, braucht es eine saubere Struktur und klare Verantwortlichkeiten.

In den folgenden Abschnitten gehen wir auf diese wichtigen Säulen im Detail ein – orientiert an den Anforderungen moderner IT-Umgebungen.

Notfallorganisation

Eine Notfallorganisation dient im Rahmen einer Krise dazu, eine strukturierte, schnelle und effektive Reaktion zu ermöglichen. Sie stellt sicher, dass ein Unternehmen oder eine Organisation handlungsfähig bleibt. Hierzu zählen sowohl Koordinative Rollen, aber auch klare Verantwortlichkeiten und Eskalationswege:

  • Notfallstab / Krisenstab – Steuert das Notfallmanagement, trifft Entscheidungen, priorisiert Maßnahmen und stellt Ressourcen bereit.
  • IT-Notfallteam – Verantwortlich für die technische Wiederherstellung von IT-Systemen, Backups und Failover
  • IT-Disaster-Recovery-Manager – Verantwortlich für den DR-Plan, Backup-Strategien und die Wiederherstellung der IT-Infrastruktur.
  • Fachbereichsverantwortliche – Identifizieren kritische Geschäftsprozesse, unterstützen die Wiederaufnahme der Arbeit.
  • Kommunikationsteam – Koordiniert interne und externe Kommunikation, informiert Mitarbeitende, Kunden und Behörden.
  • Business Continuity Manager – Stellt sicher, dass Notfallmaßnahmen geschäftskritische Prozesse abdecken, führt Tests durch.
  • Krisenmanager – Leitet den Notfallstab, trifft strategische Entscheidungen und überwacht die Umsetzung des Notfallplans.
  • Sicherheitsbeauftragter / CISO – Überwacht Informationssicherheit, bewertet Bedrohungen und sorgt für die Einhaltung von Sicherheitsstandards.

Notfallarbeitsplätze

Kurz gesagt Alternativen für betroffene Standorte, Systeme oder Datenspeicher, um innerhalb der Krise flexibel auf Standort- oder IT-Ausfälle zu reagieren.

  • Die umfasst einen Ort zum Arbeiten. Der Notfallarbeitsplatz sollte an einem sicheren, leicht zugänglichen Ort eingerichtet werden, der im Falle eines Notfalls schnell erreicht werden kann. Dies könnte ein externes Büro, ein Konferenzraum oder ein temporäres Büro in einem anderen Gebäude sein. Der Ort sollte über die notwendige Infrastruktur verfügen, wie Stromversorgung, Internetzugang und Telefonverbindungen, um einen reibungslosen Arbeitsablauf zu gewährleisten.
  • Notebooks oder PCs sollten bereitgestellt werden, die mit der erforderlichen Software und den notwendigen Anwendungen ausgestattet sind, um die Arbeit fortzusetzen. Die Geräte sollten so konfiguriert sein, dass Mitarbeiter schnell darauf zugreifen können, ohne lange Einrichtungszeiten, aber dennoch geschützt vor dem aufgetreten Desaster.
  • Ein zentraler Notfallspeicher sollte bereits im Normalbetrieb eingerichtet werden, um gesicherte Daten zu speichern. Dies kann in Form von Cloud-Speicher oder externen Festplatten erfolgen. Der Zugriff auf den Notfallspeicher sollte einfach und sicher sein, sodass Mitarbeiter im Notfall schnell auf die benötigten Daten zugreifen können. Im Normalfall aber auch die Motivation haben die Daten hierauf zu sichern.

Technische Wiederherstellungspläne

Vorgehensweisen für die Wiederherstellung von Systemen, Daten und Infrastrukturen. Diese Pläne orientieren sich an den Empfehlungen und Vorgaben des BSI – Sie sollten als separates Dokument parallel zu Betriebsdokumentationen den Service, die technischen Abhängigkeiten, sowie die Wiederherstellung auf Basis keinerlei vorhandenen Informationen der IT-Infrastruktur beschreiben. Übergeordnete Dokumente stellen die einzelnen Wiederherstellungspläne in Kontext zur Infrastruktur und der Geschäftsprozesse eine Unternehmens.

Im Gegensatz zu privaten Krisen haben wir in der IT unsere Pläne in regelmäßigen Test- und Optimierung zu verbessern und auf die Probe zustellen. Regelmäßige Simulationen, wie Tabletop-Übungen oder vollständige Tests, gehören dabei ebenfalls dazu, wie eine gründliche und regelmäßige Dokumentation der Pläne und Ergebnisse um, die Reaktionsfähigkeit des Unternehmens zu überprüfen und Schwachstellen im Plan zu identifizieren. Dies ist beispielweise durch eine Dokumentenmaangement, wie auch die eine Einbeziehung in den Changeprozess möglich.

Abgrenzung zu Business Continuity

Während Disaster Recovery auf die technische Wiederherstellung nach einem Vorfall fokussiert ist, umfasst Business Continuity (BC) umfassendere Maßnahmen, um den Geschäftsbetrieb auch während einer Krise aufrechtzuerhalten. DR ist somit ein entscheidender Bestandteil einer ganzheitlichen Business-Continuity-Strategie.

Vorsorgepflicht: Disaster Recovery im regulatorischen Kontext

In Deutschland ist die Vorsorge unserer IT durch regulatorische Vorgaben geprägt. Insbesondere für Betreiber kritischer Infrastrukturen (KRITIS) sowie regulierte Branchen wie das Finanz- und Versicherungswesen ist ein funktionierender DR-Plan zwingend erforderlich und von der Compliance fest verankert:

Wichtige regulatorische Vorgaben für DR in Deutschland

  • BSI-Gesetz & IT-Sicherheitsgesetz: Betreiber kritischer Infrastrukturen müssen IT-Sicherheitsmaßnahmen ergreifen und nachweisen, dass sie angemessene DR-Konzepte implementiert haben. (BSI-Gesetz)
  • ISO/IEC 27001 & BSI-Standard 200-3: Definiert Anforderungen an Business Continuity und Disaster Recovery, inkl. Risikobewertungen, Notfallpläne und Tests (z. B. Schreibtischtests). (ISO/IEC 27001, BSI-Standard 200-3)
  • BaFin-MaRisk & VAIT: Verpflichten Finanzdienstleister zur Implementierung und Dokumentation von Notfallwiederherstellungsplänen. (BaFin-MaRisk, VAIT)
  • DORA (Digital Operational Resilience Act) ab 2025: Stellt hohe Anforderungen an IT-Resilienz für Finanzunternehmen in der EU. (EU-DORA-Verordnung)
  • NIS2-Richtlinie (ab 2025): Verschärfte Anforderungen an Cybersicherheit und Notfallvorsorge mit Sanktionen bei unzureichenden DR-Maßnahmen. (NIS2-Richtlinie)

NIS2-Ready? Mach den Check!

Ist Deine IT bereit? Erhalte eine individuelle Status-Analyse Deiner aktuellen Sicherheitsstruktur und deren NIS2-Konformität sowie konkrete Empfehlungen zur Optimierung Deiner Sicherheitsmaßnahmen. Unsere Experten nehmen sich Zeit für Dein Anliegen und beraten Dich gerne persönlich.

So funktioniert Disaster Recovery: 6 einfache Schritte zur Erstellung eines DR-Plans

Ein durchdachter Disaster-Recovery-Plan (DR-Plan) ist essenziell, um auf IT-Notfälle vorbereitet zu sein. Doch wo fängt man an? Im Folgenden werden sechs praxisnahe Schritte gezeigt, mit denen man einen strukturierten DR-Plan erstellen kann – von der Risikoanalyse bis zur regelmäßigen Überprüfung. So stellt man sicher, dass ein Unternehmen im Ernstfall handlungsfähig bleibt.

1. Risikoanalyse und Bedrohungsbewertung

Wo fange ich an? Grundsätzlich ist es ratsam und sinnvoll die gesamte IT im Rahmen des Disaster Recovery zu beleuchten – aufgrund der schieren Menge empfiehlt sich natürlich ein risikoorientiertes Vorgehen – eine bewährte Methode hierfür ist die Business Impact Analyse. Ihr Ziel ist es, die Auswirkungen von Ausfällen infolge eines Desasters zu untersuchen. Das Ergebnis gibt uns Aufschluss darüber welche Geschäftsprozesse und Ressourcen besonders geschützt werden müssen, damit eine Institution auch in Krisen und Notfällen ihre wichtigsten Ziele und Aufgaben weiterhin erfüllen kann.

Auf Basis der BIA werden mögliche Risiken identifiziert, die den IT-Betrieb gefährden könnten. Dazu gehören Cyberangriffe, Hardware-Ausfälle, Naturkatastrophen oder menschliches Versagen. Die Auswirkungen auf die Geschäftsprozesse werden bewertet. Daraus lassen sich wiederum Prioritäten für den Dienstleister ableiten, der für die Wiederherstellung verantwortlich ist.

2. Festlegung der Wiederherstellungsziele (RTO & RPO)

Ein effizienter Disaster-Recovery-Plan steht und fällt mit zwei zentralen Kennzahlen:

  • RTO (Recovery Time Objective): Die maximale Zeitspanne, in der ein System nach einem Ausfall wiederhergestellt sein muss.
  • RPO (Recovery Point Objective): Der maximale Zeitraum, für den Daten verloren gehen dürfen, ohne die Geschäftskontinuität wesentlich zu gefährden.

Woher kommen diese Werte?

Sie werden anhand einer Business Impact Analysis (BIA) festgelegt. Dabei wird bewertet, welche Systeme für den Geschäftsbetrieb kritisch sind und welche finanziellen, rechtlichen oder operationellen Folgen ein längerer Ausfall hätte.

Praxisbeispiel:

Eine Zahlungssystem kann sich maximal einen Datenverlust von wenigen Sekunden leisten (RPO ≈ 0), da jede Transaktion nachvollziehbar sein muss. Ein Ausfall darf höchstens wenige Minuten dauern (RTO ≈ 5 Min.), bevor Kunden massiv beeinträchtigt werden und das Unternehmen schaden nimmt.

Ein System zur Erstellung von Reports oder Analysen hingegen könnte es tolerieren, wenn verlorene Reports aus den letzten 2 Stunden manuell nachgefahren werden müssen (RPO = 2 Std.), solange das System innerhalb von 4 Stunden wieder läuft (RTO = 4 Std.).

3. Definition der Wiederherstellungsstrategie

Wie erreiche ich mein Ziel? Basierend auf den Wiederherstellungszielen werden konkrete Maßnahmen für Backup, Redundanz und alternative IT-Infrastrukturen definiert. Dies kann Cloud-Lösungen, Spiegelserver oder spezielle Notfallrechenzentren umfassen.

4. Erstellung des Disaster Recovery Plans

Alle Maßnahmen und Prozesse werden in einem strukturierten DRP-Dokument festgehalten. Eine standardisierte Vorlage stellt dabei das BSI zur Verfügung. BSI – BSI-Standard 200-4: Business Continuity Management

Wichtige Inhalte sind:

  • Beschreibung des IT-Service,
  • notwendigen Komponenten (Server, Datenbanken, Anwendungsaufrufe) – Informationen aus CMDB
  • Zuständigkeiten und Eskalationsstufen
  • technische und organisatorische Voraussetzungen (Abhängigkeiten zu anderen IT-Services)
  • Detaillierte Wiederherstellungsverfahren für Systeme und Daten (inkl. Zeitschätzungen)
  • Abnahme- und Testpläne
  • akzeptierte Einschränkungen im Rahmen des Notbetriebs
  • interne und externe Kontaktinformationen

5. Disaster Recovery Tests

In Schritt 4 wurde hauptsächlich die theoretische Vorsorge beschrieben. Allerdings kann nur durch regelmäßige Tests sichergestellt werden, dass der DRP funktioniert und auch den aktuellen internen und externen Anforderungen entspricht. Unternehmen, die unter DORA oder NIS2 fallen, müssen solche Tests auch aus regulatorischen Gründen durchführen und dokumentieren.

Tests verifizieren einerseits die Vorgehensweise, zeigen aber auch Abhängigkeiten auf und verbessern die Zusammenarbeit mit abhängigen IT-Services. Während der DRP ausschließlich mit dem Produktverantwortlichen bzw. IT-Service-Verantwortlichen erstellt wird, wird beim Testen über den Tellerrand hinaus geschaut.

Die Durchführung dieser Tests kann unterschiedlich aussehen und muss nicht auf der produktiven Infrastruktur erfolgen – die Infrastruktur sollte jedoch die organisatorischen und technischen Rahmenbedingungen und Voraussetzungen widerspiegeln.

Zu DR-Tests gehören:

Schreibtischtest (Tabletop-Exercise)

In einer simulierten Umgebung (z.B.: im Rahmen eines Rollenspiels) wird der DRP mit den Verantwortlichen durchgespielt. Ziel ist es, Lücken oder Unklarheiten im Plan frühzeitig zu identifizieren und Anpassungen vorzunehmen, bevor ein echter Notfall eintritt.

  • Theoretische Durchsprache des DRP mit den verantwortlichen Teams
  • Identifikation von Lücken und Verbesserungspotenzialen
  • Simulierte Krisenszenarien ohne Eingriff in den Live-Betrieb
Simulationstest

Der Simulationstest ist eine praxisnahe Übung, bei der ein Notfallszenario realistisch nachgestellt wird, hierbei werden nicht unbedingt alle Einzelheiten der produktiven Umgebung nachgestellt – im wesentlichen soll hier der technische Prozess nachempfunden werden.

  • Praktische Nachstellung eines Ausfalls in einer isolierten Umgebung
  • Überprüfung der Backup- und Wiederherstellungsprozesse
  • Kein Einfluss auf den produktiven Betrieb
Real-Test (Live-DR-Test)

Im Real- oder Live-DR-Test wird der DRP unter realen Bedingungen getestet, beispielsweise durch das Wiederherstellen eines Systems im Rahmen des Wiederherstellungsplans (z.B.: Back oder Neuinstallation) oder das Umschalten auf ein Ersatzrechenzentrum. Dieser Schritt stellt sicher, dass alle Prozesse wie geplant funktionieren und die definierten RTO- und RPO-Werte eingehalten werden können.

  • Reale Wiederherstellung eines Systems oder Umschaltung auf ein Notfall-Rechenzentrum
  • Messung der Wiederherstellungszeiten (RTO, RPO)
  • Hoher Aufwand, aber wichtigste Erkenntnisse für die Praxis

6. Kontinuierliche Verbesserung und Wartung

Was hat das mit Business Continuity zu tun? Ein DRP ist ein lebendes Dokument, das regelmäßig aktualisiert und an veränderte Geschäftsanforderungen angepasst werden muss. Nach jedem Test, nach jedem tatsächlichen Notfall, sowie auch bei Änderungen des IT-Services sollten Erfahrungen dokumentiert und Optimierungen umgesetzt werden. Es empfiehlt sich im Rahmen eines Dokumentenmanagement oder z.B.: im Rahmen des Changeprozesses Änderungen, wie bei einem Betriebshandbuch abzufragen.

Der Disaster-Recovery-Plan (DRP): Warum er so wichtig ist

Die Risiken fehlender DR – ist wie die vergessene Vorsorge im Falle einer Erkrankung:

Das Fehlen eines Disaster-Recovery-Plans (DR-Plan) für die IT „kann“ schwerwiegende Konsequenzen für Unternehmen haben. Die potenziellen Risiken und möglichen Gegenmaßnahmen lassen sich in folgende Kategorien unterteilen:

1. Operative Risiken und Schutz der Betriebsabläufe

  • Unterbrechung der Geschäftskontinuität: Ohne einen DR-Plan kann ein Unternehmen bei IT-Ausfällen seine Geschäftsprozesse nicht aufrechterhalten. Datenverlust droht. Dies führt dazu, dass Mitarbeiter ihre Arbeit nicht fortsetzen können und Kunden beeinträchtigt werden.
  • Gegenmaßnahme: Ein gut durchdachter DR-Plan legt Service Level Agreements (SLAs) für jede einzelne Anwendung fest. Dies stellt sicher, dass geschäftskritische Anwendungen besonders geschützt sind und schnell wiederhergestellt werden können.

2. Finanzielle Risiken und Begrenzung von Verlusten

  • Hohe Kosten durch Ausfallzeiten: IT-Ausfälle verursachen erhebliche finanzielle Verluste. Studien zeigen, dass die durchschnittlichen Kosten für IT-Ausfallzeiten bis zu 17.000 US-Dollar pro Minute betragen können.

3. Reputationsrisiken und Schutz des Unternehmensimages

  • Verlust des Kundenvertrauens: Unternehmen, die nach einer Katastrophe nicht schnell operativ sind, verlieren das Vertrauen ihrer Kunden, was Investitionen behindern und die Marktposition schwächen kann.

4. Sicherheitsrisiken und Verbesserung der Leistung

  • Anfälligkeit für Cyberangriffe: Unternehmen ohne aktuellen DR-Plan sind besonders anfällig für Bedrohungen wie Ransomware.

Wichtige Elemente eines effektiven Disaster-Recovery-Plans

Ein effektiver Disaster-Recovery-Plan basiert auf mehreren zentralen Elementen, die eine schnelle und strukturierte Wiederherstellung ermöglichen.

Zunächst ist eine detaillierte Beschreibung der betroffenen Assets erforderlich, einschließlich ihrer Inhalte und Funktionen. Die Assets müssen so beschrieben werden, dass zum eindeutigen Verständnis keine weiteren Informationen aus Datenbanken benötigt werden – die Infrastruktur dieser Datenbanken ist zum Zeitpunkt des Bedarfs nicht verfügbar.

Ebenso müssen technische Abhängigkeiten klar erfasst werden, um mögliche Auswirkungen auf andere Systeme frühzeitig zu erkennen.

Ein wesentlicher Bestandteil sind genau definierte Wiederherstellungsschritte, die sicherstellen, dass die betroffenen Systeme geordnet und effizient wieder in Betrieb genommen werden können. Dabei ist es wichtig, klare Zeiteinheiten – beispielsweise in Stunden – zu verwenden, um realistische Erwartungen an die Wiederherstellungsdauer zu setzen.

Zur Unterstützung des Wiederherstellungsprozesses sollten sinnvolle Dokumentverknüpfungen integriert werden, damit Administratoren schnell auf relevante Anleitungen und Informationen zugreifen können. Darüber hinaus spielt die Benutzerfreundlichkeit eine entscheidende Rolle: Eine vertraute Umgebung für IT-Administratoren erhöht die Akzeptanz und erleichtert die Umsetzung des Plans im Ernstfall.

Nicht zuletzt ist eine übergeordnete Gesamtkoordination essenziell. Durch gut durchdachte Koordinationspläne wird sichergestellt, dass alle Beteiligten effizient zusammenarbeiten und der gesamte Wiederherstellungsprozess reibungslos verläuft. Dies ist Aufgabe des IT-Disaster-Recovery-Manager.

Fazit: Warum jedes Unternehmen einen Disaster-Recovery-Plan braucht

Im Privatleben treffen wir viele Vorsorgemaßnahmen, um auf unvorhersehbare Ereignisse vorbereitet zu sein: Wir schließen Versicherungen ab, legen Notfallkontakte fest und sichern wichtige Dokumente. Ähnlich verhält es sich im Geschäftsbereich – hier übernimmt der Disaster Recovery Plan (DRP) diese Funktion.

Ein gut durchdachter DRP stellt sicher, dass Unternehmen nach einem Notfall wie einem Cyberangriff, einem Hardware-Ausfall oder einer Naturkatastrophe schnell wieder handlungsfähig sind. Ohne eine klare Strategie kann ein IT-Ausfall zu erheblichen finanziellen Verlusten, Reputationsschäden und sogar zur Existenzgefährdung führen.

Gerade in Zeiten zunehmender Cyberbedrohungen und regulatorischer Anforderungen wie DORA oder NIS2 ist Disaster Recovery kein optionales Extra, sondern eine geschäftskritische Notwendigkeit. Nur wer im Voraus richtig vorsorgt, kann im Ernstfall schnell und kontrolliert reagieren. Regelmäßige Tests stellen sicher, dass der Plan aktuell bleibt und im Notfall zuverlässig funktioniert.

Letztendlich ist ein DRP wie eine Versicherung für das Unternehmen: Man hofft, ihn nie zu brauchen – aber wenn doch, macht er den entscheidenden Unterschied zwischen Chaos und einer strukturierten, schnellen Wiederherstellung des Geschäftsbetriebs.

Inhaltsverzeichnis

Inhaltsverzeichnis

    Newsletter