C.5. Стандартные поведения: Кластер с 2 или 4 узлами, использующий сетевой арбитраж

Разделение сети

Стандартные причины: Неисправность сетевого коммутатора.

Контрольный пример: Подключите половину узлов к коммутатору A. Подключите к коммутатору B другую половину. Соедините коммутатор A с коммутатором B, используя порт up-link или перекрещенный кабель. Подключите устройство, с IP-адресом арбитра, к коммутатору A. Запустите службы кластера. Отключите коммутатор A от коммутатора B.

Ожидаемое поведение: Оба раздела кластера, состоящие из половины (1 из 2 или 2 из 4) узлов, посылают пакеты ping по IP-адресу арбитра. Если ответ получен, этот раздел формирует кворум. В контрольном примере это означает, что кворум сформируют узлы, подключенные к коммутатору A. Так как для работы Cluster Manager нужна полностью подключенная сеть, случай, когда происходит разделение поровну (или пополам) и обе части распавшейся сети достигают IP арбитра, не обрабатывается.

Проверка: Запустите clustat на узлах подключенных к коммутатору A. В верхней части вывода команды должно появиться значение Cluster Quorum Incarnation.

Потеря доступа к общему хранилищу

Стандартные причины: Общее хранилище осталось без питания или отсоединён кабель, соединяющий его с узлом кластера.

Контрольный пример: Отключите от узла кабель SCSI или Fibre Channel.

Ожидаемое поведение: В ответ на потерю доступа к общему хранилищу выполняется заданное действие (перезагрузка/остановка/отключение/продолжение работы). По умолчанию – перезагрузка.

Повисание системы или сбой (panic) на узле кластера

Контрольный пример: Уничтожьте демонов cluquorumd и clumembd.

killall -STOP cluquorumd clumembd

Ожидаемое поведение: Этот узел кластера отключается другим узлом. Службы переносятся. Если используется сторожевой таймер, он также может сработать.