Jan. 31st, 2021

Best Practices for Networking
To keep vSphere HA agent traffic on the networks you have specified, configure hosts so vmkNICs used by vSphere HA do not share subnets with vmkNICs used for other purposes. vSphere HA agents send packets using any pNIC that is associated with a given subnet when there is also at least one vmkNIC configured for vSphere HA management traffic. Therefore, to ensure network flow separation, the vmkNICs used by vSphere HA and by other features must be on different subnets.
https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.avail.doc/GUID-B1906BCD-E538-4FFF-AAE9-5403FE253F38.html

VMware High Availability и проверка изоляции
С другой стороны, использование маршрутизатора по умолчанию в качестве адреса для проверки изоляции не является хорошей идеей, поскольку в небольших компаниях в качестве маршрутизатора может использоваться, например, ISA Server, развернутый в виртуальной машине. Это может привести к ситуации, когда сервер ESXi будет успешно пересылать пакеты любой из запущенных на нем ВМ (в пределах одного виртуального коммутатора), хотя в действительности окажется изолированным от физической сети.

Наконец, в ряде случаев, возможно и ложное срабатывание, когда все узлы кластера, подключенные к одному коммутатору, из-за кратковременной недоступности сети посчитают себя изолированными и остановят свои виртуальные машины.

Для предотвращения этой ситуации следует, во-первых, дублировать сетевое оборудование, во вторых, добавить проверку дополнительных адресов, прописав в Advanced Options настройках HA кластера параметры das.isolationaddress и/или das.isolationaddress{n}.

Первый параметр позволяет задать один дополнительный адрес для проверки изоляции, второй, точнее остальные - до десяти дополнительных адресов (в различных документах описывается, что параметры должны иметь значение das.isolationaddress1, das.isolationaddress2, ... das.isolationaddress10, хотя на практике мне удавалось задать и das.isolationaddress0; номер в названии параметра влияет на очередность при проверке).
http://blog.vmpress.org/2011/04/vmware-high-availability.html?m=1

Host Failure Types
In a vSphere HA cluster, three types of host failure are detected:
Failure. A host stops functioning.
Isolation. A host becomes network isolated.
Partition. A host loses network connectivity with the primary host.
https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.avail.doc/GUID-4ED552C3-0291-4553-A46A-290EF883BC8D.html

BEACON PROBING DEEP-DIVE
By Martin Gavanda Posted March 25, 2019 In Architecture, VMware, vSphere basics
https://learnvmware.online/2019/03/25/beacon-probing-deep-dive/

What is beacon probing? (1005577)
https://kb.vmware.com/s/article/1005577

И наконец, где можно получить проблемы: не всегда аппаратная часть отрабатывает корректно, например по факту порты при некорректной прошивке, могут рапортовать что выключены, но по факту включены.
New Reliability, Availability, and Serviceability (RAS) Features in the Intel® Xeon® Processor Family
Adaptive Double DRAM Device Correction (ADDDC)
https://software.intel.com/content/www/us/en/develop/articles/new-reliability-availability-and-serviceability-ras-features-in-the-intel-xeon-processor.html

Intel Optane DC Persistent Memory Module (DCPMM)
https://www.compuway.ru/2019/04/03/intel-optane-memory/

Configuring Reliable Memory in Per-virtual machine basis (2146595)
https://kb.vmware.com/s/article/2146595

vSphere Support for Intel's Optane Persistent Memory (PMEM) (67645)

https://kb.vmware.com/s/article/67645

Profile

robopet3

May 2023

S M T W T F S
 12 3456
78910111213
14151617181920
21222324252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 4th, 2025 09:02 am
Powered by Dreamwidth Studios