Ausfallberichte
ca. 2 Stunden, 26 Minuten Ausfall von h01
Kategorie: AusfallberichtSamstag, 29. Januar 2005
Ausfall durch geplanten Reboot von h01
Ursache: Auf h01 kam es in den letzten Wochen immer wieder zu Performance-Problemen. Deshalb entschloss man sich zu einem Umzug einer Vielzahl von Paketen auf den neuen Hive h03 (Yuam). Leider ergaben sich längere Ausfälle als geplant. Die...
37 Minuten Routing-Probleme
Kategorie: AusfallberichtDonnerstag, 27. Januar 2005
Ausfall der Route zu den Servern in Berlin
Ursache: unbekannt
Maßnahmen: durch ISP e.G.
Ausfallzeit: 13:35 bis 14:12.
Betroffen: Alle Pakete!
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Thomas Kramer
Hostmaster Hostsharing e.G.
5 Minuten Ausfall des zentralen SSL-Apachen auf h01
Kategorie: AusfallberichtSonntag, 23. Januar 2005
Bei einer Konfigurationsumstellung des SSL-Apachen von h01/pima ist ein Fehler aufgetreten.
Ursache: Eindeutig menschliches Versagen, Hostmaster war zu blöd (nach Selbstaussage :->).
Ausfall: 19:55 bis 20:00.
Betroffen: Pakete des Hives h01 (Host pima), die den zentralen SSL-Apachen...
6 Minuten Ausfall mysql-Dienste
Kategorie: AusfallberichtMittwoch, 19. Januar 2005
Ein oder mehrere mySQL Server hingen
Ursache: unbekannt
Maßnahmen: Die Server mussten hart terminiert und neu gestartet werden.
Ausfall ca. 15:56 bis 16:02.
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Paul Hink
Hostmaster Hostsharing e.G.
56 Minuten Ausfall von Pima (h01)
Kategorie: AusfallberichtMittwoch, 19. Januar 2005
Ausfall des zentralen Webservers von h01/pima.
Ursache: unbekannt
Maßnahmen: Ein Restart per Init-Script alleine half nicht, der Prozess, der die TCP-Sockets geöffnet hatte, hing und wurde beim Restart nicht beendet. Nach dem manuellen Beenden dieses Prozesses lief der Apache wieder.
Ausfall:...
14 Minuten Ausfall von Pomo (h02)
Kategorie: AusfallberichtMittwoch, 19. Januar 2005
Installation des LInux-Kernels 2.6.11-rc1
Ursache: Auf pima läuft seit gestern morgen der neue Kernel problemlos, daher wurde auch pomo (h02) in der Wartungszeit erneut neugestartet, um dort das Kernel-Update durchzuführen.
Ausfall: 2:23 bis 2:37
Für den Ausfall bitte ich im Namen der...
38 Minuten Ausfall Pima (h01)
Kategorie: AusfallberichtDienstag, 18. Januar 2005
Geplanter Ausfall
Ursache: XFS Filesysteme werden überprüft. Da zwei Zope Server immer wieder automatisch neu starten, ist außerdem leider ein Reboot notwendig.
Ausfallzeit: 5:55-6:33
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Michael Hönnig
Hostmaster Hostsharing e.G.
4 Minuten Ausfall von Pomo (h02)
Kategorie: AusfallberichtDienstag, 18. Januar 2005
Geplanter Ausfall
Ursache: XFS Filesysteme werden überprüft
Ausfallzeit: 5:23-5:27
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Michael Hönnig
Hostmaster Hostsharing e.G.
48 Minuten Server nicht erreichbar
Kategorie: AusfallberichtSonntag, 16. Januar 2005
Die Rechner von Berlin sind von extern nicht erreichbar.
Ursache: Information von der ISP e.G.: Es waren keine Routing-Probleme im eigentlichen Sinne, sondern gestörte Leitungen wegen einer Überlastung durch einen amoklaufenden Webserver eines anderen (Reseller-) Kunden der ISP e.G.
Maßnahmen:...
erneut 5 Minuten Ausfall wegen Reboot
Kategorie: AusfallberichtSamstag, 15. Januar 2005
Vermutlich seit dem Reboot gibt es Probleme mit dem Versenden von Mail: 451 Error: queue file write error.
Ursache: Die Vermutung ist, dass das Mail-Problem mit dem XFS vom Kernel zu tun hat. Daher müssen wir leider nochmal neu booten.
Maßnahmen: Reboot mit den alten Kernels. Ausfall nochmal je...

