Introducing G2.ai, the future of software buying.Try now

Failover

von Sagar Joshi
Failover ist die Fähigkeit, bei einem Ausfall oder einer Ausfallzeit des Hauptsystems auf zuverlässige Backup-Systeme umzuschalten. Erfahren Sie mehr über seine Arten und Anwendungen.

Was ist ein Failover?

Ein Failover ist ein Sicherungsbetrieb, der das primäre System auf einen sekundären Computer, ein Netzwerk oder eine Komponente umschaltet, wenn das zentrale System ausfällt oder vorübergehend heruntergefahren wird. Es stellt sicher, dass die Systeme während der Ausfallzeit weiterhin funktionieren und Dienste bereitstellen.

Verwaltete Domain-Name-System (DNS)-Anbieter helfen Organisationen, Failover zu verwalten, während sie den DNS-Verkehr steuern. Es verhindert Systemausfälle und hilft dem Unternehmen, Kosten zu sparen. Systemausfälle bedeuten nicht unbedingt einen Verlust von Verkäufen oder Produktivität, aber wenn es Schäden im Zusammenhang mit Service Level Agreements (SLAs) gibt, können Strafen entstehen.

Failover sind Teil einer umfassenden Risikomanagementstrategie und helfen Unternehmen, die Kontinuität in unvorhergesehenen Vorfällen aufrechtzuerhalten.

Viele Organisationen nutzen Failover-Clustering, um ein Netzwerk von Systemen und Servern einzusetzen, um Softwareanwendungen fehlertolerant zu machen. Sie streben eine konsistente Verfügbarkeit an. Wenn ein Server ausfällt, übernimmt ein anderer seinen Platz und seine Last. Dieser Prozess erfordert mehrere physische Server und virtuelle Systeme.

Arten von Failover

Es gibt Faktoren wie Budgetbeschränkungen und technische Anforderungen, die Organisationen berücksichtigen, bevor sie den Failover-Typ wählen, den sie einsetzen möchten. Nachfolgend sind einige bemerkenswerte Failover-Typen auf dem Markt aufgeführt.

  • Aktiv-passives Failover: Dies ist das häufigste Failover. Hier wird das sekundäre oder passive System nur dann aktiv, wenn das primäre System beschädigt ist.
  • Aktiv-aktives Failover: Die primären und sekundären Systeme arbeiten zusammen, um die Arbeitslast zu bewältigen. Wenn ein System oder eine Komponente ausfällt, übernimmt das andere, um eine effiziente Ressourcennutzung sicherzustellen. Es erfordert jedoch komplexes Lastenausgleich und Synchronisation.
  • Lastenausgeglichenes Failover: Mehrere Server laufen parallel, und ein Lastenausgleich verteilt ihre Arbeitslast. Wenn eine Komponente ausfällt, wird die Arbeitslast auf die verbleibenden Server verteilt.
  • Geografisches Failover: Es setzt Sicherungssysteme an mehreren Standorten ein, um entfernte Standorte vor Ausfällen durch Unfälle zu schützen.
  • Datenbank-Failover: Diese sind für Datenbanken konzipiert und beinhalten primäre und Standby-Datenbanken. Wie bei anderen Failovers übernimmt die sekundäre oder Standby-Datenbank, wenn die primäre Datenbank ausfällt.
  • Cloud-basiertes Failover: Verwendet Cloud-Ressourcen als Failover-Mechanismus. Dies ist in hybriden Umgebungen üblich, in denen Cloud-Dienste als Sicherung für lokale Ausfälle genutzt werden.
  • Speicher-Failover: Beinhaltet mehrere identische Speichersysteme. Wenn der primäre Speicher ausfällt, stellt der andere Speicher die Datenzugänglichkeit sicher.
  • Anwendungsebene-Failover: Einige Apps verfügen über eingebaute Failover-Funktionen. Wenn die App auf einem Server ausfällt, kann sie automatisch neu starten oder auf den zweiten Server wechseln.
  • Netzwerk-Failover: Es behält Kopien von Netzwerkpfaden und -komponenten. Das System folgt automatisch dem zweiten Pfad, wenn ein Netzwerkpfad ausfällt.
  • Domain-Name-System (DNS)-Failover: Verwendet DNS-Management, um den Verkehr auf einen anderen Server oder eine andere Site umzuleiten, wenn die primäre Site einen Fehler anzeigt oder nicht verfügbar ist.

Was passiert bei einem Failover?

Failover sorgt für einen mühelosen Übergang von einem primären zu einem sekundären System in Krisenzeiten. Hier ist, was genau passiert.

  • Anfangszustand: Das primäre System bedient aktiv Anfragen.
  • Auslöser: Fehler im primären System erkannt.
  • Failover-Aktivierung: Das sekundäre System übernimmt automatisch die Aktion.
  • Verkehrsumleitung: Alle Anfragen werden nun an das sekundäre System geleitet.
  • Wiederherstellung des primären Systems: Failback tritt ein, wenn das primäre System repariert ist und alles zum primären System zurückkehrt.
  • Überwachung: Stellt Stabilität und Bereitschaft sicher, um die Zuverlässigkeit des Dienstes aufrechtzuerhalten.

Failover-Anwendungen

Verschiedene Sektoren nutzen Failover entsprechend ihren Anforderungen. Nachfolgend sind einige häufige Anwendungsfälle in verschiedenen Branchen aufgeführt.

  • Finanzdienstleistungen: Banken und Finanzinstitute nutzen Failover, um die kontinuierliche Verfügbarkeit von Transaktionsverarbeitungssystemen sicherzustellen. Diese Organisationen setzen oft aktiv-aktive Failover-Mechanismen für hohe Verfügbarkeit ein.
  • Gesundheitswesen: Krankenhäuser und Gesundheitsdienstleister nutzen Failover, um den Zugang zu elektronischen Gesundheitsakten (EHRs) aufrechtzuerhalten. Sie setzen Datenbankreplikation und Virtualisierung ein, um die Datenintegrität und Zugänglichkeit sicherzustellen. Der Einsatz von Failover reduziert hier die Ausfallzeiten erheblich und gewährleistet die Patientensicherheit und Kontinuität der Versorgung.
  • E-Commerce: Online-E-Commerce-Unternehmen nutzen Failover, um die Verfügbarkeit von Websites zu verwalten, insbesondere bei Veranstaltungen mit hohem Verkehrsaufkommen. In der Regel verteilen Lastenausgleicher den Verkehr gleichmäßig auf alle Server, mit aktiv-aktiven Konfigurationen, um Spitzen zu bewältigen.
  • Telekommunikation: Sie nutzen Netzwerk-Failover, um einen unterbrechungsfreien Dienst sicherzustellen. Sie implementieren mehrere Komponenten und Pfade, um die Konnektivität aufrechtzuerhalten, selbst wenn ein Knoten ausfällt.
  • Cloud-Dienstanbieter: Sie haben eingebaute Failover-Optionen für gehostete Apps und Daten. Diese nutzen eine Kombination aus geografischem Failover und Virtualisierung, um die Dienstkontinuität weltweit sicherzustellen.
  • Regierung und öffentlicher Sektor: Notfallmanagement- und öffentliche Sicherheitsabteilungen nutzen Failover, um kritische Infrastrukturen während Notfällen und Katastrophen ohne Unterbrechung am Laufen zu halten.

Best Practices für effektives Failover-Management

Effektives Failover-Management ist entscheidend für die Sicherstellung der Geschäftskontinuität und Widerstandsfähigkeit. Nachfolgend sind einige Best Practices aufgeführt, die Unternehmen befolgen können.

  • Testen Sie Failover-Systeme. Häufige Überprüfungen und Tests können Fehlfunktionen des Failovers während eines Ausfalls verhindern. Simulierte Failover-Übungen helfen, potenzielle Probleme im Prozess zu identifizieren und zu beheben.
  • Aktualisieren Sie Failover-Pläne. Überprüfen Sie Strategien, um neue Technologien, infrastrukturelle Änderungen und verbesserte Ziele zu implementieren. Regelmäßige Audits und Überprüfungen der Failover-Verfahren stellen sicher, dass sie mit den aktuellen Praktiken und technologischen Änderungen übereinstimmen.
  • Schulen Sie das Personal. Benutzer sollten den Failover-Aktionsplan und ihre Rolle während eines aktiven Failover-Ereignisses kennen. Erhöhtes Bewusstsein hilft den Benutzern, die Bedeutung der Vorbereitung auf die effektive Ausführung von Failover-Plänen zu verstehen.

Erfahren Sie mehr darüber, wie Failover die Serviceverfügbarkeit für Unternehmen verbessern.

Sagar Joshi
SJ

Sagar Joshi

Sagar Joshi is a former content marketing specialist at G2 in India. He is an engineer with a keen interest in data analytics and cybersecurity. He writes about topics related to them. You can find him reading books, learning a new language, or playing pool in his free time.