21. Oktober 2003 06:11h: 2 Stunden Routing-Störung
Liebe Mitglieder und sonstige Hostsharing-Nutzer,Auswirkung
Am Dienstag, den 21. Oktober 2003, gab es von ca. 6:11h bis 8:11h starke Routing-Störungen.
Ursache
Die Ursache ist bisher unbekannt. Es wird ein Fehler in der BGP Konfiguration vermutet. Die BGP Router selbst waren erreichbar, nur hinter den Routern gab es hohe Paket-Verluste.
Details
Ein Hostsharing-Hostmaster war um 6:14h alarmiert und meldete den Fehler bei der ISP eG, unserer Rack-Gemeinschaft, die auch die Router betreut. Dort war der Fehler bereits bekannt und wurde gesucht.
Auffällig war, dass einige Hosts hinter den BGP Routern "nur" Paket-Verluste von ca. 50% hatten, andere aber von fast 100%. Evtl. gilt dies sogar abhängig vom Client-Subnetz oder AS.
Maßnahmen
Konkrete Maßnahmen können wir erst festlegen, sobald die Ursache bekannt ist. Wir haben bei der ISP eG einen Bericht angefordert.
An allgemeinen Maßnahmen haben wir vorgeschlagen:
- Einarbeitung eines weiteren BGP-Administrators, den die Hostsharing eG stellen würde.
- Bereithaltung eines statischen Routers (statt BGP) für den Fall dass die BGP Router Fehlkonfigurationen aufweisen. Die Fehlersuche und Neu-Konfiguration dauert üblicherweise 2 Stunden, die wir dann größtenteils überbrücken könnten.
Auch für diese Vorschläge von uns steht eine Antwort von der ISP eG noch aus.
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
- Michael Hönnig
Hostmaster Hostsharing eG

