08. Dezember 2003 12:46h: 50 Minuten DW+SW Ausfall
Liebe Mitglieder und sonstige Hostsharing-Nutzer,Auswirkung
Am Montag, den 8. Dezember waren unsere Dienste von 12:46h bis 13:36h leider nicht verfügbar.
Ursache
Die Ursache war ein notwendig gewordender harter Neustart des Servers, weil dieser nicht mehr reagierte (Hänger). Die Dauer erklärt sich durch einen (misslungenen) Quota-Reparaturlauf sowie den Wechsel nach ext2.
Details
Der Server verhielt sich um 12:46h sehr ähnlich wie vor Monaten als wir mit ext3 in einen Linux-Kernel-Fehler gelaufen sind, der bei hohem Load mit Quota auf einigen Systemen auftritt. Dieser sollte angeblich mit dem am 2. Dezember eingespielten Kernel 2.4.23 behoben sein. Evtl. ist er nicht behoben.
Funktioniert hat noch ein neuer Login als normaler user, ein "su -" zu root jedoch hing sich sofort auf. Auch war ein Aufruf von "uptime" zwar möglich (Load ca. 1000), aber kein Aufruf von "top" (Hänger). Ebenso führte ein "rc mysql stop" und "rc httpd stop" nur zum direkten Aufhängen der jeweiligen Shell. Ein Login über die Remote-Konsole war gar nicht mehr möglich.
Somit blieb als Alternative nur noch der harte Neustart per Powerswitch.
Das Verhalten beim Ausfall vom 5. Dezember war ählich, beim Ausfall von 26.11. (noch mit ext2) jedoch stieg der Load weiter. Das System reagierte am 26.11. extrem langsam, am 5. und 8. Dezember jedoch bei gewissen Aktionen gar nicht mehr.
Maßnahmen
Zunächst sind wir wieder auf ext2 umgestiegen. Weitere Maßnahmen sind nach Festellung der Ursache zu klären.
Für den Ausfall bitte ich im Namen der Hostmaster um Entschuldigung.
- Michael Hönnig
Hostmaster Hostsharing eG

