Категорії
VMware: Troubleshooting

ESXi 7.0U1: Возможные проблемы при апдейте и использовании

Последней актуальной версией ESXi является 7.0U1. Она совсем свежая – работать с обновлением мы можем, начиная с 6 октября 2020 года. Переход на нее для многих стал неминуемой перспективой, а кое-кто уже успел столкнуться с рядом проблем в процессе апдейта или использования.

Что ж, темой этого разговора как раз и станет troubleshooting ESXi 7.0U1.

Проблемы с сетью

  • Issue: Одно или несколько устройств ввода-вывода не генерируют прерывания при использовании AMD IOMMU. Если устройства ввода-вывода на ESXi-хосте предоставляют суммарно более 512 различных источников прерываний, некоторым источникам ошибочно назначается превышающий максимальное значение индекс записи таблицы переназначения прерываний (IRTE) в AMD IOMMU. В результате прерывания от такого источника теряются и соответствующее устройство ввода-вывода ведет себя так, как будто прерывания отключены.

Resolve: Использовать команду ESXCLI «esxcli system settings kernel set -s iovDisableIR -v true» для отключения преобразователя прерывания AMD IOMMU. Перезагрузить хост ESXi, чтобы команда вступила в силу.

Проблемы с хранилищем

  • Issue: Потеря доступа навсегда к VMFS-хранилищу данных, поддерживаемому устройством NVMe over Fabrics или пространством имен, в процессе восстановления после сбоя APD или PDL. Получить доступ к стораджу нельзя ни с vCenter Server, ни с ESXi-хоста.

Resolve: Выполнить повторное ресканирование на уровне кластера или хоста.

Проблемы автоматического развертывания

  • Issue: Хост ESXi с адаптерами шины Emulex и Qlogic (HBA) не загружается по протоколу PXE с помощью vSphere Auto Deploy, выдавая сетевую ошибку:

Could not open net0: Input/output error http://ipxe.org/1d6a4a98′
Network error encountered while PXE booting.
Scanning the local disk for cached image.
If no image is found, the system will reboot in 20 seconds ……
Could not boot. No such device (http://ipxe.org/2c048087)

Ей подвержены адаптеры Emulex HBA:

HPE StoreFabric CN1200E-T 10Gb Converged Network Adapter

HPE StoreFabric CN1200E 10Gb Converged Network Adapter

HP FlexFabric 20Gb 2-port 650FLB Adapter

HP FlexFabric 20Gb 2-port 650M Adapter

Что касается Qlogic HBA, подобная ошибка вылетает периодически.

Обнаружение хостом проблемы в PXE Boot-консоли обозначится, например, для двух-портового Qlogic HBA Ethernet 10 Гбит 530T, сообщением:

Configuring (net0 f4:03:43:b4:88:d0)……
No configuration methods succeeded (http://ipxe.org/040ee186)
Network error encountered while PXE booting.

Resolve: нет.

Проблемы установки, обновления и миграции

  • Issue: Завершение установки драйверов 7.0U1 на ESXi 7.0-7.0b ошибкой:

VMW_bootbank_qedrntv_3.40.4.0-12vmw.701.0.0.xxxxxxx requires vmkapi_2_7_0_0, but the requirement cannot be satisfied within the ImageProfile. ​
Please refer to the log file for more details.

Resolve: Обновить хост ESXi до последней версии и повторить установку драйвера.

Разные проблемы

  • Issue: При запуске команды ESXCLI для отключения модуля файервола служба hostd дает сбой и узлы ESXi теряют связь (автоматизация настройки брандмауэра в среде).

Resolve: Отключать файервол не рекомендуется в любом случае. Если же его действительно необходимо вывести из активного состояния, следует проделать следующее:

  1. Остановить службу hostd командой «/etc/init.d/hostd stop».
  2. Отключить брандмауэр командой «esxcli network firewall unload».
  3. Проделать все необходимые операции.
  4. Загрузить модуль файервола командой «esxcli network firewall load».
  5. Запустить службу hostd командой «/etc/init.d/hostd start».
  • Issue: Операции vSphere Storage vMotion в среде vSAN выдают ошибку при неавторизованной сессии Network File Copy (NFC). В случае миграции в хранилище данных vSAN в процессе неавторизированной сессии NFC при помощи vSphere Storage vMotion виртуальных машин с другой политикой хранения и минимум одним снэпшотом, а также несколькими виртуальными дисками выдается ошибка, так как тело Simple Object Access Protocol (SOAP) превышает допустимый размер.

Resolve: Перенести вначале домашнее пространство имен виртуальной машины и минимум один виртуальный диск. После завершения запустить чисто дисковую миграцию для оставшихся дисков.

  • Issue: Изменения атрибутов и свойств хранилища на ESXi-хосте не сохраняются после перезагрузки. Если в процессе процедуры обнаружения устройств во время перезагрузки хоста ESXi превышается таймаут, подключаемый модуль jumpstart может не получить данные по измененной конфигурации устройств и хранилища ото всех зарегистрированных на хосте устройств. После перезагрузки свойства хранилища или устройств восстановятся до значений по умолчанию.

Resolve: Вручную восстановить изменения в свойствах.

  • Issue: При использовании бета-сборки ESXi 7.0, узлы хоста выходят из строя с сиреневым «экраном смерти» во время lifecycle-операций (при выключении драйвера или переключении между ENS-режимом и родным режимом драйвера). К примеру, при изменении режима ENS в обратной трассировке выпадет сообщение об ошибке, вроде такого:

case ENS::INTERRUPT::NoVM_DeviceStateWithGracefulRemove hit BlueScreen: ASSERT bora/vmkernel/main/dlmalloc.c:2733.

Resolve: Обновить клиент до ESXi 7.0 GA.

Как только появятся мысли, что делать с нерешенными проблемами, приведенными выше, либо же еще найдутся какие-то интересные проблемы, этот материал обязательно будет дополнен.