Überwachung eines Servers, auf dem ein VMware vSphere ESXi v5 Hypervisor läuft

Hinweis: Dieser Artikel wurde von einem technischen Experten verfasst, der nach der besten Lösung für einen Testserver suchte.

Die Überwachung des korrekten Betriebs der Controller der LSI MegaRAID-Familie auf Servern, auf denen der VMware vSphere ESXi v5.5-Hypervisor läuft, musste organisiert werden - und dementsprechend sollten automatisch Benachrichtigungen im Falle von Fehlern (z. B. bei Ausfall einer der HDDs) eingehen. Im Verlauf der Tests stellte sich heraus, dass die Lösung nicht auf Hypervisor-Datenspeicher beschränkt ist.

Um diese Aufgabe zu lösen, haben wir einen Testserver auf der Basis des Supermicro X9DR3/i-F-Motherboards mit einem LSI MegaRAID SAS 9260-4i-Controller verwendet, an den zwei HDDs angeschlossen waren und RAID1 konfiguriert wurde.

Obwohl LSI MegaRAID SAS 9260-4i offiziell von ESXi unterstützt wird, können Sie im Abschnitt „Health Status“ des VMware vSphere-Clients keine RAID-Statusinformationen abrufen: VMware vSphere - Supermicro X9DR3-F

Glücklicherweise lässt sich dies beheben. Wir gehen auf die Website lsi.com und finden dort das Archiv mit „SMIS Provider“ für den gewünschten Controller: Choose on site SMIS Provider

Herunterladen, entpacken und die Datei mit der Erweiterung "vib" suchen. Dies ist ein Paket, das die Überwachung des Controller-Status mit Hilfe des eingebauten ESXi-Sensor-Mechanismus ermöglicht. Kopieren Sie diese vib auf den Server, verbinden Sie sich über SSH mit ihm und starten Sie die Installation:
esxcli software vib install -v /vmfs/volumes/datastore1/500.04.V0.53-0003.vib We copy the vib to the server and connect via SSH

Wir starten den Server neu, verbinden uns erneut über SSH mit ihm und stellen sicher, dass das Paket installiert ist:
esxcli software vib list | grep -i lsi check the installation of packages

Jetzt können wir im Abschnitt „Health Status“ den Status des LSI MegaRAID-Controllers beobachten: Checking the LSI MegaRAID controller in VMware vSphere

Server Colocation

Server Colocation

Erfahren Sie mehr über unsere Rechenzentren in Deutschland für Colocation

Mehr erfahren

Automatisierung des Sensor Polling

Aber das reicht natürlich nicht aus, um eine automatische Überwachung zu organisieren, da wir von dem Ausfall erst erfahren, wenn wir den VMware vSphere-Client starten. Es ist notwendig, den Vorgang der Sensorabfrage zu automatisieren. Dazu verwenden wir das Skript "check_esxi_hardware.py", das unter http://www.claudiokuenzler.com/nagios-plugins/check_esxi_hardware.php zur Verfügung steht. Es handelt sich hauptsächlich um eine Erweiterung für Nagios, ist aber recht universell und kann leicht mit anderen Überwachungssystemen verbunden werden.

Das Skript ist in der Programmiersprache Python geschrieben und benötigt die PyWBEM-Bibliothek. Unter Linux Debian und Ubuntu wird es über die Standard-System-Repositories installiert:
apt-get install python-pywbem

Die Syntax für die Ausführung von „check_esxi_hardware.py“ ist recht einfach:
check_esxi_hardware.py -H XXX.YYY.WWW.ZZZ -U root -P XXXXXXXX

Als Antwort erhalten Sie einen kurzen Bericht über den Zustand des Servers:
OK - Server: Supermicro X9DR3-F s/n: 0123456789 System BIOS: 3.0a 2013-07-31

Sie können sicherstellen, dass das Skript den Status aller Sensoren, einschließlich des LSI MegaRAID-Controllers, abfragt, indem Sie die detaillierte Ausgabe von Informationen aktivieren:
check_esxi_hardware.py -H XXX.YYY.WWW.ZZZ -U root -P XXXXXXXX -v VMware vSphere

Der Nachteil des Skripts ist, dass es zum Abfragen der Sensoren die Autorisierungsdaten des Hypervisor-Administrators benötigt. Dieser muss nicht unbedingt root sein, aber er muss über die entsprechenden Rechte verfügen, sonst kann es die Sensoren nicht abfragen.

Versuchen wir nun, den Ausfall einer der HDDs zu simulieren. Wir starten den Server neu und rufen das WebBIOS des Controllers auf. Wählen Sie eines der Laufwerke aus: WebBIOS

Gehen wir zu dessen Eigenschaften: WebBIOS properties

Deaktivieren: disable the disk in WebBIOS

Wir laden den Hypervisor und im VMware vSphere-Client sehen wir, dass tatsächlich ein Fehler vorliegt: VMware vSphere crash

Und so sieht das Ergebnis von „check_esxi_hardware.py“ aus: heck_esxi_hardware.py

Stichworten:

#server #linux

Hat dir der Artikel gefallen?

Cookie-Zustimmung

Indem Sie auf «Ich stimme zu» klicken, stimmen Sie der Verwendung von Cookies auf unserer Website zu. Die Verwendung dieser Cookies dient der Optimierung Ihrer Nutzererfahrung, indem u. a. Präferenzen für kommende Besuche auf unserer Website gespeichert werden. Sie können unter «Cookies verwalten» detaillierte Einstellungen vornehmen und Ihre Cookie-Auswahl anpassen. Mehr dazu

Cookie-Einstellungen

funktional

Funktionale bzw. notwendige Cookies sind für die Grundfunktionen der Website von entscheidender Bedeutung und die Website funktioniert ohne sie nicht wie vorgesehen.

analyse

Analytische Cookies werden verwendet, um zu verstehen, wie Besucher mit der Website interagieren.

werbung

Werbe-Cookies werden verwendet, um Besuchern relevante Anzeigen und Angebote bereitzustellen.