C.6. Стандартные поведения: Кластер из 3 или 5 узлов

Разделение сети

Стандартные причины: Неисправность сетевого коммутатора

Контрольный пример: Подключите больше половины узлов к коммутатору A. Подключите оставшиеся узлы к коммутатору B. Соедините коммутатор A с коммутатором B, используя порт up-link или перекрещенный кабель. Запустите службы кластера. Отключите коммутатор A от коммутатора B.

Ожидаемое поведение: Часть кластера, включающая большинство узлов, продолжает работать, формируется новое представление кворума кластера. Узлы, находящиеся в меньшинстве, выключаются, и, если это возможно, службы, работавшие на них, запускаются на узлах в большинстве. В рамках данного примера это означает, что узлы, подключенные к коммутатору A, отключат узлы, подключенные к коммутатору B.

Проверка: Запустите clustat на узле, подключенном к коммутатору A. В верхней части вывода команды должно появиться значение Cluster Quorum Incarnation.

Повисание системы на узле кластера

Контрольный пример: Уничтожьте демона clumembd.

killall -STOP clumembd

Ожидаемое поведение: Этот узел кластера отключается другим узлом. Службы переносятся. Если настроен сторожевой таймер, он также может сработать.

Потеря доступа к общему хранилищу

Стандартные причины: Общее хранилище осталось без питания или отсоединён кабель, соединяющий его с узлом кластера.

Контрольный пример: Отключите от узла кабель SCSI или Fibre Channel.

Ожидаемое поведение: В ответ на потерю доступа к общему хранилищу выполняется заданное действие (перезагрузка/остановка/отключение/продолжение работы). По умолчанию – перезагрузка.