Unternehmen mit virtualisierten Infrastrukturen verlangen maximale Verfügbarkeit und Ausfallsicherheit. Proxmox VE kombiniert Open-Source-Technologien zu einem hochverfügbaren Cluster-System, das selbst bei Hardwareausfällen den Betrieb fortführt – ohne Lizenzkosten, aber mit Enterprise-Performance.
Dieser Beitrag erklärt den Aufbau eines Proxmox-Clusters, die HA-Funktionalität, typische Konfigurationen und praktische Empfehlungen für produktive Umgebungen.
1. Grundlagen: Clusterarchitektur in Proxmox VE
Ein Proxmox-Cluster ist eine logische Gruppe von mindestens zwei Nodes, die gemeinsam verwaltet werden. Die Kommunikation erfolgt über das Corosync-Protokoll , das Statusinformationen und Quorum-Daten austauscht.
| Komponente | Funktion | Beschreibung |
|---|---|---|
| Corosync | Cluster-Kommunikation | Verantwortlich für Status & Quorum |
| pmxcfs (Proxmox Cluster File System) | Konfigurations-Replikation | Repliziert VM-Konfigs auf alle Nodes |
| pve-ha-manager | High-Availability-Überwachung | Startet VMs neu bei Node-Ausfall |
| Fence-Mechanismus | Fehlerisolation | Trennt fehlerhafte Nodes vom Cluster |
Cluster-Netzwerk
-
Empfohlen: dediziertes 1 Gbit / 10 Gbit-Netz für Corosync
-
Redundante NICs mit Bonding (Active-Backup)
-
MTU-Wert synchronisiert auf allen Nodes
2. Aufbau eines HA-Clusters
Beispiel: 3-Node-Cluster
| Node | Rolle | Besonderheiten |
|---|---|---|
| pve01 | Primary | Quorum-Master |
| pve02 | Secondary | Failover-Target |
| pve03 | Secondary | Backup-Node / Ceph-Client |
Schritt-für-Schritt-Konfiguration
-
Cluster initialisieren: pvecm create clustername
-
Nodes hinzufügen: pvecm add
-
Quorum prüfen: pvecm status
-
HA-Ressource definieren: Über Web-GUI oder CLI (ha-manager add vm:100)
-
Funktion testen: Node simuliert abschalten → VM sollte automatisch neu starten.
3. Hochverfügbarkeit (HA) verstehen
Der HA-Manager überwacht definierte Ressourcen (z. B. VMs / Container). Fällt ein Node aus, erkennt Corosync den Verlust und startet die Ressource auf einem anderen verfügbaren Host neu.
| Ereignis | Aktion des HA-Managers |
|---|---|
| Node offline | VM auf anderem Node gestartet |
| Quorum verloren | Keine Aktion (Cluster-Freeze) |
| Node wieder online | Synchronisierung & Status-Recovery |
Wichtig: Ein HA-Cluster ist nur so stabil wie sein Quorum-Design. Für Produktionssysteme gilt:
-
mindestens 3 Nodes
-
Ceph-Storage oder NFS-Backend mit gleichbleibendem Zugriff
4. Best Practices
| Bereich | Empfehlung |
|---|---|
| Netzwerk | dediziertes Corosync-LAN, LACP-Bonding |
| Storage | Shared Storage (Ceph, iSCSI, NFS via TrueNAS) mit multipath |
| Monitoring | Aktivieren von Syslog, ha-manager status, E-Mail-Alerts |
| Backup | Integration mit Proxmox Backup Server |
| Test | Regelmäßig Failover-Simulationen durchführen |
Beispiel: Ceph-Cluster-Layout
| Komponente | Anzahl | Beschreibung |
|---|---|---|
| OSDs | 6 | Storage-Disks pro Node |
| MONs | 3 | Cluster-Monitoring |
| MGRs | 2 | Management-Prozesse |
| MDS | 1 | Optional für CephFS |
5. Nutzen für Unternehmen
-
Keine Lizenzkosten: HA-Funktion nativ enthalten
-
Minimale Ausfallzeiten: automatisiertes Failover
-
Skalierbarkeit: einfache Node-Erweiterung
-
Zentrales Management: alle Ressourcen über Web-GUI und API
Beispielrechnung (bei 10 VM-Hosts): Lizenzkosten-Ersparnis vs. proprietäre Lösung ≈ 30–40 % jährlich.
6. Fazit
Proxmox VE bietet echte Enterprise-High-Availability ohne Zusatzlizenz. Durch transparente Architektur, offene Standards und einfache Automatisierung ist es ideal für produktive IT-Infrastrukturen mit hohem Verfügbarkeitsanspruch.
Jetzt Beratung oder Demo anfordern
Ihre IT soll immer laufen. Mit Proxmox VE sichern Sie Hochverfügbarkeit ohne Lizenzkosten – unsere Experten unterstützen bei Design, Cluster-Aufbau und Betrieb.
Jetzt kostenlose Erstberatung anfragen
DATAZONE unterstützt Sie bei der Umsetzung — kontaktieren Sie uns für eine unverbindliche Beratung.
Mehr zu diesen Themen:
Weitere Artikel
Linux Server Hardening: Die wichtigsten Sicherheitsmaßnahmen
Linux-Server absichern: SSH-Hardening, Firewall, automatische Updates, Benutzerrechte und weitere Maßnahmen für Debian und Ubuntu im Unternehmenseinsatz.
DATAZONE Control: IT-Monitoring und Patch-Management zentral steuern
IT-Infrastruktur zentral überwachen und patchen — mit DATAZONE Control. Monitoring, Updates und Konfigurationsmanagement für Proxmox, OPNsense und Linux.
Disaster Recovery für KMU: Ausfallzeiten minimieren
Disaster Recovery Planung für kleine und mittlere Unternehmen: RPO, RTO, Backup-Strategien und konkrete Maßnahmen gegen IT-Ausfälle.