Ausfallberichte
1 Stunde 30 Minuten Ausfall von h01/pima
Kategorie: AusfallberichtDonnerstag, 12. Januar 2006
Ursache: unbekannt
Ausfallzeit laut Monitoring von 2:19 Uhr bis 3:49 Uhr
41 Minuten Ausfall auf h01/pima
Kategorie: AusfallberichtMontag, 26. Dezember 2005
Ursache: Reboot wegen Kernel-Update
Ausfallzeit: 5:40 bis 6:21
4 Minuten Ausfall des SSL-Webservers auf h01/pima
Kategorie: AusfallberichtDonnerstag, 15. Dezember 2005
Ursache unbekannt
Maßnahme: manueller Neustart
Ausfallzeit: 22:07 bis 22:11
Stundenlanger Komplettausfall und diverse Folgeausfälle auf h03/yuma
Kategorie: AusfallberichtSamstag, 10. Dezember 2005
Ursache: zwei defekte Festplatten
Maßnahmen: Zunächst Reboot-Versuche. Dann im Rechenzentrum: Austausch der Festplatten, dann Umzug der Pakete auf cusa und Neustart aller Dienste.
Beginn des Ausfalls: 09.12.2005, 6:39
Ende des Ausfalls:
Email-Dienste: 16:45
ssh: 17:06
mysql:...
2 Stunden 12 Minuten Ausfall von h01/pima
Kategorie: AusfallberichtFreitag, 2. Dezember 2005
Ursache: offenbar zwei hängende Prozesse
Maßnahme: manuelle Beendigung der Prozesse
Ausfallzeit: 0:45 bis 2:57
Ausfälle auf h02/pomo
Kategorie: AusfallberichtFreitag, 25. November 2005
Ursache: möglicherweise zu strenge ulimits
Maßnahmen: Erhöhung der ulimits
Ausfallzeiten: Static-Web-Webserver (h02/pomo) von 0:27bis 3:23 Uhr. Zentraler Dynamic-Web-Webserver auf h02/pomo von 3:06 bis3:23 Uhr.
13 Minuten Ausfall aller Dienste auf h03/yuma
Kategorie: AusfallberichtFreitag, 25. November 2005
Ursache: unbekannt
Maßnahme: Reboot
Ausfallzeit von 10:53 Uhr bis 11:06 Uhr
18 Minuten Routingprobleme
Kategorie: AusfallberichtDonnerstag, 24. November 2005
Ursache: unbekannt
Ausfallzeit: 11:01 bis 11:19 Uhr
1 Stunde 16 Minuten diverse Ausfälle auf h02/pomo
Kategorie: AusfallberichtDienstag, 22. November 2005
Ursache: unbekannt
Ausfallzeit: 14:04 bis 15:20
1 Stunde 40 Minuten Ausfall auf h02/pomo
Kategorie: AusfallberichtMontag, 21. November 2005
Ursache: timeout
Maßnahme: http-dump Neustart
Ausfallzeit: 12:05 bis 13:45 Uhr

