Best Practices for Networking
To keep vSphere HA agent traffic on the networks you have specified, configure hosts so vmkNICs used by vSphere HA do not share subnets with vmkNICs used for other purposes. vSphere HA agents send packets using any pNIC that is associated with a given subnet when there is also at least one vmkNIC configured for vSphere HA management traffic. Therefore, to ensure network flow separation, the vmkNICs used by vSphere HA and by other features must be on different subnets.
https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.avail.doc/GUID-B1906BCD-E538-4FFF-AAE9-5403FE253F38.html
VMware High Availability и проверка изоляции
С другой стороны, использование маршрутизатора по умолчанию в качестве адреса для проверки изоляции не является хорошей идеей, поскольку в небольших компаниях в качестве маршрутизатора может использоваться, например, ISA Server, развернутый в виртуальной машине. Это может привести к ситуации, когда сервер ESXi будет успешно пересылать пакеты любой из запущенных на нем ВМ (в пределах одного виртуального коммутатора), хотя в действительности окажется изолированным от физической сети.
Наконец, в ряде случаев, возможно и ложное срабатывание, когда все узлы кластера, подключенные к одному коммутатору, из-за кратковременной недоступности сети посчитают себя изолированными и остановят свои виртуальные машины.
Для предотвращения этой ситуации следует, во-первых, дублировать сетевое оборудование, во вторых, добавить проверку дополнительных адресов, прописав в Advanced Options настройках HA кластера параметры das.isolationaddress и/или das.isolationaddress{n}.
Первый параметр позволяет задать один дополнительный адрес для проверки изоляции, второй, точнее остальные - до десяти дополнительных адресов (в различных документах описывается, что параметры должны иметь значение das.isolationaddress1, das.isolationaddress2, ... das.isolationaddress10, хотя на практике мне удавалось задать и das.isolationaddress0; номер в названии параметра влияет на очередность при проверке).
http://blog.vmpress.org/2011/04/vmware-high-availability.html?m=1
Host Failure Types
In a vSphere HA cluster, three types of host failure are detected:
Failure. A host stops functioning.
Isolation. A host becomes network isolated.
Partition. A host loses network connectivity with the primary host.
https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.avail.doc/GUID-4ED552C3-0291-4553-A46A-290EF883BC8D.html
BEACON PROBING DEEP-DIVE
By Martin Gavanda Posted March 25, 2019 In Architecture, VMware, vSphere basics
https://learnvmware.online/2019/03/25/beacon-probing-deep-dive/
What is beacon probing? (1005577)
https://kb.vmware.com/s/article/1005577
И наконец, где можно получить проблемы: не всегда аппаратная часть отрабатывает корректно, например по факту порты при некорректной прошивке, могут рапортовать что выключены, но по факту включены.
To keep vSphere HA agent traffic on the networks you have specified, configure hosts so vmkNICs used by vSphere HA do not share subnets with vmkNICs used for other purposes. vSphere HA agents send packets using any pNIC that is associated with a given subnet when there is also at least one vmkNIC configured for vSphere HA management traffic. Therefore, to ensure network flow separation, the vmkNICs used by vSphere HA and by other features must be on different subnets.
https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.avail.doc/GUID-B1906BCD-E538-4FFF-AAE9-5403FE253F38.html
VMware High Availability и проверка изоляции
С другой стороны, использование маршрутизатора по умолчанию в качестве адреса для проверки изоляции не является хорошей идеей, поскольку в небольших компаниях в качестве маршрутизатора может использоваться, например, ISA Server, развернутый в виртуальной машине. Это может привести к ситуации, когда сервер ESXi будет успешно пересылать пакеты любой из запущенных на нем ВМ (в пределах одного виртуального коммутатора), хотя в действительности окажется изолированным от физической сети.
Наконец, в ряде случаев, возможно и ложное срабатывание, когда все узлы кластера, подключенные к одному коммутатору, из-за кратковременной недоступности сети посчитают себя изолированными и остановят свои виртуальные машины.
Для предотвращения этой ситуации следует, во-первых, дублировать сетевое оборудование, во вторых, добавить проверку дополнительных адресов, прописав в Advanced Options настройках HA кластера параметры das.isolationaddress и/или das.isolationaddress{n}.
Первый параметр позволяет задать один дополнительный адрес для проверки изоляции, второй, точнее остальные - до десяти дополнительных адресов (в различных документах описывается, что параметры должны иметь значение das.isolationaddress1, das.isolationaddress2, ... das.isolationaddress10, хотя на практике мне удавалось задать и das.isolationaddress0; номер в названии параметра влияет на очередность при проверке).
http://blog.vmpress.org/2011/04/vmware-high-availability.html?m=1
Host Failure Types
In a vSphere HA cluster, three types of host failure are detected:
Failure. A host stops functioning.
Isolation. A host becomes network isolated.
Partition. A host loses network connectivity with the primary host.
https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.avail.doc/GUID-4ED552C3-0291-4553-A46A-290EF883BC8D.html
BEACON PROBING DEEP-DIVE
By Martin Gavanda Posted March 25, 2019 In Architecture, VMware, vSphere basics
https://learnvmware.online/2019/03/25/beacon-probing-deep-dive/
What is beacon probing? (1005577)
https://kb.vmware.com/s/article/1005577
И наконец, где можно получить проблемы: не всегда аппаратная часть отрабатывает корректно, например по факту порты при некорректной прошивке, могут рапортовать что выключены, но по факту включены.