Ausfallberichte
3 Minuten Ausfall von Pima (h01)
Kategorie: AusfallberichtSonntag, 27. Februar 2005
Ursache: unbekannt
Ausfallzeit: 17:32-17:35
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Michael Hönnig
Hostmaster Hostsharing e.G.
4 Stunden 21 Minuten Routingprobleme
Kategorie: AusfallberichtSamstag, 26. Februar 2005
Je nach Route der Gegenseite gab es hohe Paketverluste. Betroffen waren alle unsere Server in Berlin und damit alle Pakete und Dienste (abgesehen vom Backup-MX und zwei der drei authoritativen Nameserver).
Ursache: unbekannt
Maßnahmen: Durch ISP eG
Ausfallzeit: 21:10 bis 1:31
Für den Ausfall...
6 Minuten Ausfall des DW Webservers h02/Pomo
Kategorie: AusfallberichtDienstag, 22. Februar 2005
Ursache: unbekannt
Ausfallzeit: 8:33-8:39
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Michael Hönnig
Hostmaster Hostsharing e.G.
12 Minuten Ausfall von Pima (h01)
Kategorie: AusfallberichtDienstag, 22. Februar 2005
Andauernd unidentifizierbarer hoher IO-Last (Read) auf h01
Ursache: unbekannt
Maßnahmen: Reboot. Nach dem Reboot war der hohe Read-Load auf sdc (/home) leider auch wieder da. Nach einigen Minuten war aber wieder alles normal.
Ausfallzeit: 7:02-7:14
Für den Ausfall bitte ich im Namen der...
21 Minuten Ausfall von Pima (h01)
Kategorie: AusfallberichtSonntag, 20. Februar 2005
Es ist nur der zentrale Apache von h01/pima vom Ausfall betroffen.
Ursache: unbekannt
Maßnahmen: Der zentrale Webserver von h01/pima wurde neugestartet (drei apache-Prozesse hingen und mussten manuell per kill -9 beendet werden)
Ausfallzeit: 6:46 bis 7:07
Für den Ausfall bitte ich im Namen...
17 Minuten Ausfall von Pomo (h02)
Kategorie: AusfallberichtMontag, 7. Februar 2005
Ursache: wieder out of memory
Maßnahmen: Reboot per fernschaltbarer Steckdose.
Ausfallzeit: 0:03 bis 0:20
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Paul Hink
Hostmaster Hostsharing e.G.
34 Minuten Ausfall von Pomo (h02)
Kategorie: AusfallberichtSonntag, 6. Februar 2005
Ursache: pomos Arbeitsspeicher ist voll, auf der seriellen Konsole ist zu beobachten, wie der Kernel (oom-killer) viele Apache-Prozesse beendet, wohl um wieder freien Spceicher zu bekommen. pomo reagiert auch per ssh ab und an wieder.
Maßnahmen: Das System auf pomo schien sich alleine nicht wieder...
12 Minuten Ausfall auf Pomo (h02)
Kategorie: AusfallberichtSamstag, 5. Februar 2005
Es gab erneut einen Ausfall des zentralen SSL-Apachen von h02/pomo.
Ursache: unbekannt
Maßnahmen: Reboot.
Ausfallzeit laut Monitoring: 16:38 bis 16:50.
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Paul Hink
Hostmaster Hostsharing e.G.
5 Minuten Ausfall von Pomo (h02)
Kategorie: AusfallberichtSamstag, 5. Februar 2005
Es gab einen kurzen Ausfall der zentralen http- und https-Apachen von h02/pomo.
Ursache: unbekannt
Maßnahmen: Da deren Prozesse ungewöhnlich hohe Last erzeugt hatten, wurden sie neugestartet. Dieser Neustart scheint aus ungeklärten Gründen ohne unmittelbare Fehlermeldung fehlgeschlagen zu...
16 Minuten Ausfall auf h01
Kategorie: AusfallberichtSonntag, 30. Januar 2005
Das Filesystem hängt an einer Stelle, so dass das Backup nicht weiterlaufen kann.
Ursache: unbekannt
Maßnahmen: Reboot und Überprüfung vom /home Filesystem mit xfs_check.
Ausfall: 6:20 bis 6:36
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Michael Hönnig
Hostmaster...

