Ausfallberichte
3 Stunden 40 Minuten Ausfall von h03/yuma
Kategorie: AusfallberichtSamstag, 19. November 2005
Ursache: unbekannt.
Maßnahme: harter Reboot
Ausfallzeit laut Monitoring: 5:01 bis 8:41 Uhr.
33 Minuten Ausfall des zentralen ssl-Servers von h02/pomo
Kategorie: AusfallberichtFreitag, 11. November 2005
Ursache: unbekannt. Möglicherweise Karneval :-)
Maßnahmen: Keine
Ausfallzeit: 16:23 Uhr bis 16:56 Uhr
4 Minuten Ausfall von h01/pima
Kategorie: AusfallberichtMontag, 7. November 2005
Ursache: Apache Resart.
Maßnahmen: Keine
Ausfallzeit: 22:02 Uhr bis 22:06 Uhr
32 Minuten Ausfall von h03/yuma
Kategorie: AusfallberichtSamstag, 29. Oktober 2005
Probleme mit Filesystem, alle Dienste von h03 betroffen. Maßnahmen: Probleme mit dem zentralen Webserver, Login auf h03 aber nicht möglich (Passwort-Abfrage statt Public-Key Akzeptanz). Login auch über Remote Konsole nicht möglich
Ursache: unbekannt
Maßnahme: Reset per Powerswitch.
Ausfallzeit...
25 Minuten Routingprobleme
Kategorie: AusfallberichtSamstag, 22. Oktober 2005
Ursache: Wartungsarbeiten
Maßnahmen: durch ISP eG
Ausfallzeit: 1:01 Uhr bis 1:26 Uhr
4 Minuten Ausfall auf h03/yuma
Kategorie: AusfallberichtFreitag, 21. Oktober 2005
Ursache: Ein überflüssiges und daher vor kurzem deinstalliertes Apache-Modulwar nicht aus der Konfiguration des zentralen Webservers entferntworden. Bei einem Neustart des Webservers konnte dieser daher aufgrundder fehlerhaften Konfiguration nicht wieder starten.
Ausfallzeit: 21:25 bis...
20 Minuten hoher Load auf h03/yuma
Kategorie: AusfallberichtMittwoch, 19. Oktober 2005
Ursache: womöglich ein hängender MySQL-Prozess.
Maßnahme: Reboot
Ausfallzeit: Webserver: ca. 10:52-11:12, mySQL: ca. 10:52-11:18
15 Minuten Routing Probleme
Kategorie: AusfallberichtDienstag, 18. Oktober 2005
Ursache: unbekannt.
Maßnahmen: durch ISP eG
Ausfallzeit (mit Unterbrechnungen) 8:53-9:08
22 Minuten Routing-Probleme
Kategorie: AusfallberichtFreitag, 14. Oktober 2005
Ursache: Rückmeldung von der ISP e.G.: Es gab nicht genauer bekannte Problememit einem der Router zu einem Subnetz, aus dem wir einige IP-Adressen nutzen.
Maßnahmen: Reboot durch ISP eG.Hätte dies nicht geholfen, wäre der defekte Router abgeschaltet wordenund der komplette Traffic über eine...
8 Minuten Ausfall des zentralen Webservers
Kategorie: AusfallberichtDonnerstag, 6. Oktober 2005
Ursache: unbekannt.
Wie schon am 26. September hatten sich die Apache-Prozesse bis auf zwei alle beendet. Letzte Einträge im Error-Logfile diesmal:
[Thu Oct 6 14:05:48 2005] [notice] SIGUSR1 received. Doing graceful restartaccept_mutex_on: Identifier removed[Thu Oct 6 14:05:58 2005] [notice]...

