2.11. Проверка конфигурации кластера

Чтобы убедиться в правильности настроек кластерного программного обеспечения, воспользуйтесь следующими инструментами, расположенными в каталоге /usr/sbin:

В следующих разделах эти инструменты рассматриваются более подробно.

2.11.1. Проверка общих разделов

Общие разделы на всех узлах должны относиться к одному физическому устройству. Запустите утилиту /usr/sbin/shutil с параметром -v для проверки определения общих разделов и их доступности.

Если команда выполнилась успешно, запустите следующую команду /usr/sbin/shutil -p /cluster/header на всех узлах и просмотрите структуру заголовков в общих разделах. Если выводимые данные отличаются на разных узлах, это означает, что общие разделы на разных узлах указывают на разные устройства. Убедитесь в том, что неформатированные устройства определены и правильно указаны в файле /etc/sysconfig/rawdevices. Обратитесь к разделу 1.4.4.3 Настройка общих разделов кластера за дополнительной информацией.

В следующем примере показано, что на обоих узлах кластера clu1.example.com и clu2.example.com общие разделы ссылаются на одно физическое устройство, исходя из результата команды /usr/sbin/shutil -p /cluster/header:


/cluster/header is 140 bytes long
SharedStateHeader {
        ss_magic = 0x39119fcd
        ss_timestamp = 0x000000003ecbc215 (14:14:45 May 21 2003)
        ss_updateHost = clu1.example.com

Все поля, выводимые командой /usr/sbin/shutil -p /cluster/header, должны совпадать при запуске этой команды на всех узлах кластера. Если результаты команды на всех узлах не совпадают, выполните следующее:

Выполнив эти действия, перезапустите утилиту /usr/sbin/shutil с параметром -p.

2.11.2. Проверка переключателей питания

Если в вашей конфигурации кластера используются переключатели питания с сетевым или последовательным интерфейсом, проверьте их после установки программного обеспечения кластера, выполнив команду clufence. Выполнив эту команду на каждом узле, убедитесь в том, что он может удалённо отключить/включить другой узел. Если проверка прошла успешно, можно переходить к запуску кластера.

Команда clufence может проверить работу переключателя питания, только при неработающем кластере. Это объясняется тем, что в случае с переключателями, подключенными через последовательный порт, только одна программа в один момент времени может обращаться к этому порту. Программа clufence используется для проверки состояния программного обеспечения кластера. Если кластерное программное обеспечение запущено, программа прерывается и сообщает о необходимости остановить кластер.

Ниже приведены параметры командной строки утилиты clufence:

Проверяя работу переключателей питания, сначала необходимо убедиться, что каждый узел кластера может взаимодействовать с подключенным к нему переключателем питания. Следующий пример выполнения команды clufence демонстрирует, что узел кластера может связаться с переключателем питания:

[27734] info: STONITH: rps10 at /dev/ttyS0, port 0 controls clumember1.example.com
[27734] info: STONITH: rps10 at /dev/ttyS0, port 1 controls clumember2.example.com

В случае ошибки при выполнении clufence, проверьте следующее:

Проверив соединение с переключателем, попытайтесь отключить/включить другой узел кластера. Предварительно мы рекомендуем вам проверить, что другой узел кластера в этот момент не выполняет какие-либо важные действия (например, его кластерные службы не обслуживают активных клиентов). Команда clufence -f clumember2.example.com выводит после успешного отключения и укрытия узла (то есть, перевода его в состояние, когда он не получит питания от переключателя питания, пока не будет открыт) следующие сообщения:

[7397] info: STONITH: rps10 at /dev/ttyS0, port 0 controls clumember1.example.com
[7397] info: STONITH: rps10 at /dev/ttyS0, port 1 controls clumember2.example.com
[7397] notice: STONITH: clumember2.example.com has been fenced!

2.11.3. Отображение текущей версии программного обеспечения кластера

Убедитесь в том, что на всех узлах кластера работает одна версия Red Hat Cluster Manager.

Просмотреть версию программ Настройка кластера (Cluster Configuration Tool) и Состояние кластера (Cluster Status Tool) можно следующими способами: