Seit heute morgen 05:15 sind die Performance Engpässe vorbei.
In der Nacht von Sonntag, den 11. Juni 2017 auf Montag, den 12. Juni 2017 sind unsere zentralen Storage Server (Tier1: SSD basiert) um 02:40 Uhr ausgefallen. Der Grund für den Ausfall war ein Software Fehler in der Storage Software (GlusterFS).
Unsere Mitarbeiter haben umgehend reagiert und die zentralen Storage Server (Tier1: SSD basiert) stehen seit 03:25 Uhr wieder zur Verfügung. Der Ausfall hat dazu geführt, dass sich die beiden Storage Server untereinander synchronisierten (abglichen). Diese Synchronisation wiederum führte zu hohen Disk Schreib- und Lese-Zugriffen, was wiederum zu Performance Engpässen bei den virtuellen Maschinen führte.
Die Daten-Konsistenz konnte trotz des Ausfalls gewahrt werden und es sind keine Daten verloren gegangen!
Wir entschuldigen uns für diesen Vorfall und hoffen auf Ihr Verständnis.