Mein EVE-NG Server für Labore hat hier und da ganz schön gehangen, obwohl es ein neue AMD EPYC ist, EVE hat 64 CPU Kerne zugewiesen und 384GB RAM. Das wurde eigentlich nie ausgelastet, aber trotzdem kam es vor dass einfach nichts mehr richtig ging.
Heute habe ich einige Einstellungen auf dem Server angepasst, dazu gehören die Änderung des Arbeitsspeicherprofils auf Performance, was schnellere Ansprechzeiten versprechen soll. Zudem wurde innerhalb des Hypervisors ESXi die Latenzempfindlichkeit auf Hoch geändert. Diese Funktion ist vor allem für Systeme gedacht die keine hohen Wartezeiten für I/O oder RAM verkraften können. Somit erhält EVE-NG Vorrang vor anderen VMs auf diesem Server. Um diese Einstellung durchführen zu können, wurde EVE-NG der zugewiesene Arbeitsspeicher garantiert, somit sind nun dauerhaft 384GB RAM, von 512GB, für EVE-NG bereit und priorisiert. Weiterhin wurden insgesamt 77GHz CPU Taktrate für EVE-NG garantiert, das entspricht etwa 33 Kernen dieses Servers. Insgesamt darf EVE-NG auf 64 Kerne zugreifen.
Weiterhin wurde im Hypervisor eingestellt, dass die C-States der beiden CPUs nicht genutzt werden sollen und er auf Höchstleistung laufen soll. Auch eine Einstellung die nötig ist um die Funktion Latenzempfindlichkeit auszunutzen.
Was hat das nun alles gebracht?
In der kürze der Zeit kann ich noch kein eindeutiges Ergebniss zeigen. Aber aus Erfahrung mit EVE-NG weiß ich, dass z.B. das starten vieler Nodes, gleichzeitig, zu Problemen führen kann. Manche starten nicht oder bleiben hängen. Manchmal dauert es auch einfach extrem lang. Das kam nun nicht mehr vor, innerhalb kürzester Zeit lief mein Arista Labor mit 19 QEMU Nodes (je 2 CPUs, 4GB RAM). zusätzlich dazu hat ein Kollege sein Firewalllabor gestartet und darauf gearbeitet, ebenfalls Problemlos.
Selbst deployments in der Arista Fabric liefen Fehlerfrei, was vorher oft nicht lief, weil durch Bottlenecks auf dem Server die Streaminglatency zu hoch war. Jetzt konnte ich mehrfach Changes durchführen und Configs pushen ohne auch nur einmal in einen Fehler zu laufen.
Zum Abschluss habe ich noch geprüft wie schnell die CPU denn nun eigentlich läuft und wie die Auslastung aussieht. In diesem Screenshot seht ihr in der rechten Spalte „%A/MPERF“, das ist die Angabe der aktuellen Taktfrequenz in % der Basistaktrate.
Die Basistaktrate der CPUs ist 2,3GHz und meistens laufen sie jetzt zwischen 130% und 140%, also zwischen 3GHz und 3,2GHz. Die angegebene maximale Taktrate liegt bei 3,2GHz.
Diese Ausgabe bekommt ihr, wenn ihr per SSH auf den ESXi geht, dann „esxtop“ ausführen. Nun ein paar Tasten drücken; P; F; F; Enter (alles klein, also einfach die Taste drücken).
Danach sieht man die Anzeige wie im Bild oben.