Performance Engpässe vorbei

Auf unseren zentralen Storage Server (Tier1: SSD basiert) fand eine Synchronisation (Abgleich) der Daten statt. Dieser führte zu Performance Engpässen.

Seit heute morgen 05:15 sind die Performance Engpässe vorbei.

In der Nacht von Sonntag, den 11. Juni 2017 auf Montag, den 12. Juni 2017 sind unsere zentralen Storage Server (Tier1: SSD basiert) um 02:40 Uhr ausgefallen. Der Grund für den Ausfall war ein Software Fehler in der Storage Software (GlusterFS).

Unsere Mitarbeiter haben umgehend reagiert und die zentralen Storage Server (Tier1: SSD basiert) stehen seit 03:25 Uhr wieder zur Verfügung. Der Ausfall hat dazu geführt, dass sich die beiden Storage Server untereinander synchronisierten (abglichen). Diese Synchronisation wiederum führte zu hohen Disk Schreib- und Lese-Zugriffen, was wiederum zu Performance Engpässen bei den virtuellen Maschinen führte.

Die Daten-Konsistenz konnte trotz des Ausfalls gewahrt werden und es sind keine Daten verloren gegangen!

Wir entschuldigen uns für diesen Vorfall und hoffen auf Ihr Verständnis.

Schreib- und Lese-Zugriffe auf den beiden Storage Server.

Disk Input/Output Waits auf den beiden Storage Server.

Zurück