Service Level Agreements (SLA)

Extended Support für geschäftskritische Anwendungen

Service Level Agreements (SLA)

Hostsharing bietet SLAs für einzelne Dienste (Mailserver, Datenbankserver, Webserver), die sich kombinieren lassen. Damit können Sie Ihre Webanwendungen flexibel absichern und die Verfügbarkeit bedarfsgerecht erhöhen.

In größeren Unternehmen ermittelt das Business Continuity Management (BCM) im Rahmen einer Business-Impact-Analyse (BIA) einen differenzierten Bedarf an Service Level Agreements für den Betrieb von geschäftskritischen Webanwendungen. In kleinen und mittelständischen Unternehmen muss oft der Webmaster die Frage beantworten, welche Service Level Agreements sinnvoll sind.

Die Hostsharing eG hilft ihren Mitgliedern bei der Wahl des passenden Service Level Agreements. Zunächst sollen einige Begriffe erläutert werden, die bei der Entscheidung eine Rolle spielen.

Was meint Zuverlässigkeit?

Zuverlässigkeit bezeichnet die Wahrscheinlichkeit, dass ein IT-System während einer vorgegebenen Zeitspanne insgesamt fehlerfrei funktioniert und damit der mit ihm verknüpfte Geschäftsprozess ohne Unterbrechung durchlaufen kann. Hostsharing sorgt mit Redundanz auf zahlreichen Ebenen (Netzwerk, Speichersysteme, Energieversorgung, standortübergreifender DNS- und Mailserver-Platzierung) dafür, dass die Eintrittswahrscheinlichkeit von Fehlern, die zu einer Beeinträchtigung der Verfügbarkeit führen, bereits gering ist. Ausfälle einzelner Komponenten kann die Managed Operations Platform von Hostsharing tolerieren. Sie besitzt eine hohe Fehlertoleranz.

Was ist Hochverfügbarkeit?

Als Verfügbarkeit bezeichnet man die Wahrscheinlichkeit, dass ein System in einem bestimmten Zeitraum funktionstüchtig ist. Sie errechnet sich aus dem Verhältnis von Produktionszeit und Ausfallzeit.

Die Gleichung lautet:
Verfügbarkeit (in Prozent) = (Produktionszeit/Produktionszeit+Ausfallzeit) * 100

Eine Verfügbarkeit von 99,99 % (und damit Hochverfügbarkeit) liegt vor, wenn die Ausfallzeit eines IT-Systems pro Jahr 53 Minuten nicht übersteigt.

Hostsharing erzielt die Hochverfügbarkeit seiner Hosting-Plattform durch Redundanz. Alle wichtigen Komponenten sind doppelt vorhanden und damit redundant ausgelegt.

Was bedeutet Desasterschutz?

Desasterschutz ist ein Begriff aus dem Betriebskontinuitätsmanagement. Er bezeichnet den Schutz von Assets (in diesem Fall von digitalen Daten) bei einem katastrophalen Vorfall, wie zum Beispiel einem Brand im Rechenzentrum. Hostsharing schützt die Daten seiner Mitglieder durch tägliche Backups in ein entferntes Rechenzentrum. Die Daten gehen so selbst im Katastrophenfall nicht verloren, sodass der Betrieb fortgesetzt werden kann.

Was bedeutet Recovery Time Objective (RTO)?

Recovery Time Objective (RTO) bezeichnet die im Service Level Agreement vereinbarte Wiederherstellungsdauer. Sie gibt die Zeitspanne an, die nach einer Störung maximal bis zur Wiederherstellung des IT-Betriebs vergehen darf. Bei Hochverfügbarkeit erwartet man im Störungsfall eine Wiederherstellungsdauer nahe Null.

Hostsharing erreicht dies durch betriebsbereit vorgehaltene Ersatz-Hardware und die Replikation (Echtzeit-Spiegelung) der Daten vom Produktivsystem auf das Fail-Over-System.

Was bedeutet Recovery Point Objective (RPO)?

Recovery Point Objective (RPO) ist der zugesicherte Wiederherstellungszeitpunkt. Er spezifiziert den Zeitraum, der zwischen zwei Datensicherungen liegen darf und damit den Umfang des potenziellen Datenverlusts.

Das folgende Beispiel verdeutlicht die Auswirkungen. Wenn täglich eine Datensicherung stattfindet und nach einem Totalausfall von Systemen ein Backup eingespielt werden muss, wären maximal die Daten der letzten 24 Stunden verloren.

Durch geeignete Maßnahmen, wie das Fail-Over-System, kompensiert Hostsharing den Ausfall des Produktivsystems, sodass es entweder erst gar nicht zu einem Ausfall kommt oder der Wiederherstellungszeitpunkt nahe Null liegt.

Wie ermitteln Sie das ideale Service Level Agreement?

1. Reaktionszeit auf Basis des RTO festlegen

Das Service Level Agreement sollte so gewählt werden, dass die gewünschte Wiederherstellungsdauer (RTO) nicht überschritten wird. Wenn Sie einen RTO von maximal zehn Stunden tolerieren können, dann können Sie ein Service Level Agreement mit einer Reaktionszeit von höchstens acht Stunden abschließen. Liegt der RTO bei maximal sechs Stunden, müssen Sie ein Service Level Agreement mit einer Reaktionszeit von höchstens vier Stunden abschließen.

Je wichtiger ein bestimmter Dienst für Ihre Geschäftsprozesse ist, umso kürzer sollte die Recovery Time Objective (RTO) vereinbart werden. Die Fragen, die sich stellen, lauten daher zum Beispiel:

  • Wie lange darf das Unternehmen nicht per E-Mail erreichbar sein?
  • Wie lange darf die Firmen-Website offline sein?
  • Wie lange darf der Online-Shop gestört sein?
  • Wie lange darf ein Online-Buchungssystem für Kunden nicht erreichbar sein?
  • Wie lange dürfen bestimmte Geschäftsprozesse ausfallen?

2. Unternehmenskritische IT-Komponenten identifizieren

Anschließend ermitteln Sie, von welchen IT-Komponenten die zu schützenden Geschäftsprozesse abhängig sind. Daraus ergibt sich eine differenzierte Risikoabschätzung für wichtige und weniger wichtige Komponenten. Entsprechend differenziert sind die Service Level Agreements gestaltet, die Sie bei Hostsharing abschließen können. Hostsharing bietet Ihnen gesonderte SLAs für die folgenden Dienste an:

  • Web Server
  • MariaDB Server
  • PostgreSQL Server
  • Mail Server
  • Online Office Server

3. Kosten-Nutzen-Analyse erstellen

Aus den gewünschten Reaktionszeiten und der Liste der zu schützenden Komponenten ergeben sich die Kosten für das individuell zugeschnittene Service Level Agreement. Den Kosten können Sie dann die Schäden gegenüberstellen, die sich bei einem Ausfall ergeben. In einigen Fällen lässt sich das gut beziffern. Wenn ein Online-Shop oder ein Buchungssystem ausfällt, lässt sich der Umsatzausfall aus den durchschnittlichen Buchungen pro Stunde relativ leicht abschätzen. Der Ausfall einer rein informativen Firmen-Website ist in der Regel nicht mit einem direkten Umsatzausfall verbunden, aber er kann dem Image schaden, sodass Sie in einem solchen Fall den Schaden anders beziffern müssen.

Sie erhalten am Ende eine Aufstellung über geschäftskritische Geschäftsprozesse, die beteiligten IT-Komponenten und die in Frage kommenden Service Level Agreements. Damit haben Sie in der Regel alles beisammen, um die passenden SLAs zusammenzustellen.