Irreführende Fehlermeldungen

Hier mal wieder ein super Beispiel für irreführende System Fehlermeldungen.

Als ich am Wochenende auf mein Handy schaute, musste ich mit erstaunen feststellen, das eine unserer USVen genauer gesagt eine APC USV, mich mit Fehlermeldungen per SMS zugespammt hat.

Die Fehlermeldung lautete:

Code: 0x0002

Critical – System: Warmstart.

Hilfe ! Ab ins Auto und in die Firma !

In der Firma angekommen sah jedoch alles sehr entspannt aus… kein piepen der USV, keine roten oder wild blinkenden LEDs… alles ganz normal !

Naja, erst mal die Warnungen abgestellt und ignoriert und in ruhe geschaut was da los ist.

Nach intensiver Recherche hatte ich auch endlich ein Ergebnis für die Fehlermeldung „Critical – System: Warmstart.“ So kritisch ist diese nämlich gar nicht.

Sie kann in 2 Bedeutungen haben:

  1. Seit 10 Minuten antwortet niemand im Netzwerk auf Broadcasts oder ARP requests.
  2. Extrem hohe Netzwerklast am Ethernet Port der USV

In beiden fällen versucht die Netzwerkkarte der USV sich selbst neuzustarten (Warmstart), da sie denkt das es ein Fehler ihrerseits ist. Das macht sie jedoch so lange bis sie meint der Fehler ist behoben…. dumm nur wenn keiner da ist und den Fehler behebt!

In unserem Fall war es der FTP Server, die Logs der betreffenden USV wurde auf einem FTP Server übertragen der leider ausgefallen war (zu hohe last) dementsprechend hat die USV alle 0.x Sekunden versucht sich mit dem FTP Server zu verbinden und bekam selbst eine zu hohe Netzwerklast an ihrem Port… ein Teufelskreis^^

Warum nur kann eine solche Fehlermeldung nicht genauer sein ?

Irgendwas in der Richtung das die Netzwerkkarte einen Warmstart macht und nicht die USV !!! Dann hätte ich mir das alles doch am Wochenende ersparen können und am Montag in ruhe das Problem angehen können.