Ausfallberichte
Schlechte Performance und 18 Minuten HTTP-Totalausfall auf h01/pima
Kategorie: AusfallberichtMontag, 25. April 2005
Hoher Load, Reaktion per ssh und serieller Konsole nur sehr zäh.
Ursache: Ein hundertfach laufendes Script eines Paketusers.
Maßnahmen: Zentralen Apache gestoppt, das amoklaufende Script gestoppt. Das für das Script zuständige Mitglied ist informiert.
Ausfallzeit: Schlechte Performance laut...
33 Minuten Webserver-Probleme auf h01/pima
Kategorie: AusfallberichtDonnerstag, 21. April 2005
Ursache: Ein Apache-Prozess hing und blockierte offenbar das Starten neuer Kindprozesse.
Maßnahmen: Reboot. Leider erst um 16:09 gemerkt, weil Alarm-SMS verzoegert war.
Ausfallzeit: 15:40 bis 16:13
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Michael Hönnig
Hostmaster...
41 Minuten Ausfall von Yuma (h03)
Kategorie: AusfallberichtDonnerstag, 14. April 2005
Rechner ist noch anpingbar, aber ssh login wird mit dem Fehler "ssh_exchange_identification: Connection closed by remote host" beendet". Fehler auf der Console "scsi0 (0:0): rejecting I/O to offline device". kein Zugriff möglich. Consolenfehler wird immer weiter wiederholt.
Ursache:...
35 Minuten hoher Load auf h02/pomo
Kategorie: AusfallberichtDonnerstag, 14. April 2005
Ursache: wahrscheinlich ein Amok-laufender Prozess eines Kunden
Maßnahmen: Reboot. Kunde stoppte Anwendung.
Ausfallzeit: 13:25-13:58
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Michael Hönnig
Hostmaster Hostsharing e.G.
10 Minuten Route zu einem Subnetz gestört
Kategorie: AusfallberichtMontag, 11. April 2005
Ursache: unbekannt
Maßnahmen: Durch ISP eG
Ausfallzeit: 9:07-9:17
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Michael Hönnig
Hostmaster Hostsharing e.G.
Zwei Pakete auf h03/yuma 18 Minuten nicht erreichbar
Kategorie: AusfallberichtMittwoch, 6. April 2005
Ein Paket mit eigenem Webserver und damit einer eigenen IP-Adresse war nicht erreichbar. Nachdem eine andere IP-Adresse von yuma auf einen der anderen Paketserver umgezogen wurde, war aus ungeklärten Gründen auch die IP-Adresse dieses Pakets auf yuma nicht mehr konfiguriert. Die anderen Pakete...
25 Minuten Route zu h03/yuma gestört
Kategorie: AusfallberichtFreitag, 25. März 2005
Alle Pakete und Dienste auf h03/Yuma nicht erreichbar.
Ursache: ISP eG ist beim basteln im RZ an das Netzwerkkabel gekommen.
Maßnahmen: Durch ISP eG.
Ausfallzeit: 14:02 bis 14:27
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Thomas
Hostmaster Hostsharing e.G.
2 Stunden 21 Minuten Routingprobleme auf 02/pomo
Kategorie: AusfallberichtDonnerstag, 24. März 2005
Route zu h02 gestört, evtl. auch andere Hosts betroffen, da wir zwei Subnetze haben, die auf die Hosts verteilt sind
Ursache: unbekannt
Maßnahmen: Durch ISP eG
Ausfallzeit: 3:34 bis etwa 5:55
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Paul Hink
Hostmaster Hostsharing...
5 Minuten Ausfall von h01/pima durch Reboot
Kategorie: AusfallberichtSonntag, 20. März 2005
Ursache: I/O-Cache von h01/pima wurde seit letztem Reboot kontinuierlich kleiner.
Maßnahmen: Reboot während der Wartungszeit. Ein Reboot kann natürlich nur ein temporärer Workaround sein, bis das eigentliche Problem behoben wurde.
Ausfallzeit: 5:40 bis 5:45
Für den Ausfall bitte ich im Namen...
10 Minuten Ausfall des zentralen SSL-Webservers von h01/pima
Kategorie: AusfallberichtSonntag, 13. März 2005
Ursache: unbekannt
Maßnahmen: Der einzige vorhandene apache-ssl-Prozess musste per SIGKILL beendet werden.
Ausfallzeit: 23:08 bis 23:18
Für den Ausfall bitte ich im Namen der Hostmaster um Verzeihung.
Paul Hink
Hostmaster Hostsharing e.G.

