IBM認證知識:HACMP心跳檢測

來源:文萃谷 2.06W

與在許多其他類型的集羣中一樣,心跳檢測用於監視網絡接口、通信設備和 IP 標籤(服務、非服務和持久 IP 標籤)的可用性,從而監視節點的可用性。

IBM認證知識:HACMP心跳檢測

從 HACMP V5.1 開始,心跳檢測完全基於 RSCT 拓撲服務(因而 HACMP V5.1 只是“Enhanced Scalability”版本;使用直接由集羣管理器守護進程監視的傳統網絡接口模塊 (NIM) 的心跳檢測已不再使用)。

執行心跳檢測的方法是通過每個通信接口或設備在集羣中的節點之間交換消息(Keep Alive 數據包)。

每個集羣節點以特定間隔向其他集羣節點發送心跳信號消息,並預期以特定間隔接收來自對應節點的心跳信號消息。如果消息接收停止,則 RSCT 將此情況視為故障,並告訴 HACMP,後者將採取適當的恢復操作。

  心跳信號消息可通過以下網絡發送:

TCP/IP 網絡點對點非 IP 網絡為了防止集羣分割(split brain),HACMP 必須能夠區分節點故障和 TCP/IP 網絡故障。TCP/IP 網絡故障可能由有故障的網絡元素(交換機、集線器和電纜)導致;在這種情況下,集羣中的節點不能通過 IP 發送和接收檢測信號消息(Keep Alive,KA),因此每個節點認為對等節點發生了故障,並嘗試獲取資源。這具有潛在的數據破壞風險,在使用併發資源時尤其是如此。

非 IP 網絡是節點之間的直接連接(點對點),並且不使用 IP 來進行檢測信號消息交換,因此不太容易受到 IP 網絡元素故障的影響。如果使用了這些網絡類型,則在 IP 網絡發生故障的情況下,節點仍然能夠交換消息,因此得出的判斷是網絡故障,從而不執行任何資源組活動。

為了避免 HACMP 中發生分割,我們建議:

配置宂餘網絡(IP 和非 IP)同時使用 IP 和非 IP 網絡。若要了解一個建議的兩節點集羣配置,圖 3。

圖 3 HACMP 集羣中的信號檢測

  通過磁盤的信號檢測

通過磁盤的心跳檢測 (diskhb) 是 HACMP V5.1 中引入的新功能,旨在提供預防集羣分割的附加保護和簡化的非 IP 網絡配置,尤其是用於太難或無法實現 RS232、目標模式 SSA 或目標模式 SCSI 連接的環境。

此類網絡可以使用任何類型的共享磁盤存儲(光纖通道、SCSI 或 SSA),只要用於交換 KA 消息的磁盤是 AIX 增強併發卷組的一部分。用於信號檢測網絡的磁盤並不專門用於此目的;可以將它們用於存儲應用程序共享數據(有關更多信息,請參見圖 3)。

客户提出了使用目標模式的光纖通道連接請求,但是由於異構(非標準發起設備和目標功能)的 FC 環境(適配器、存儲子系統、SAN 交換機和集線器),此方法很難實現和支持。

通過使用共享磁盤來交換消息,非 IP 網絡的實現更加可靠,並且不依賴所使用的硬件類型。

此外,在 SAN 環境中,當使用光纖來連接設備時,這種非 IP 連接的長度具有與 SAN 相同的距離限制,

因而允許實現超長的點對點網絡。

通過將某個磁盤定義為增強的併發卷組的一部分,該磁盤的一部分(扇區)將不用於任何 LVM 操作,此磁盤部分將用於在兩個節點之間交換消息。

  使用通過磁盤的信號檢測的規範如下:

一個磁盤可用於兩個節點之間的一個網絡。同時在兩個節點上使用 LVM 分配的物理卷 ID(physical volume ID,PVID)來標識要使用的`磁盤。用於磁盤信號檢測網絡的建議配置是在每個存儲機箱中將一個磁盤用於一對節點。要求將要使用的磁盤是某個增強併發卷組的一部分,雖然該卷組不一定要是活動的或者是某個資源組(併發或非併發)的一部分。唯一的限制在於,必須同時在兩個節點上定義該卷組(volume group,VG)。注意:增強併發卷組的集羣鎖機制不使用保留磁盤空間來進行通信(“傳統”版本的 clvmd 要使用保留磁盤空間);它改為使用 RSCT 組服務。

  通過 IP 別名的心跳檢測

對於 IP 網絡,現在引入了一個新的心跳檢測功能:通過 IP 別名的信號檢測。此功能是為不能或不適宜更改通信接口的基本 IP 地址的集羣而提供的。

用於信號檢測的 IP 別名是在 HACMP 服務啟動時在現有 IP 地址之外配置的。用於此目的的 IP 地址必須與現有的 IP 地址在完全不同的子網中,並且不應該定義用於任何名稱解析(/etc/hosts、BIND 等等)。此配置不需要任何附加的可路由子網。

與使用基本/啟動 IP 地址來交換心跳信號消息不同,RSCT 使用 HACMP 定義的 IP 別名來為每個通信接口建立通信組(檢測信號環)。

注意:在使用通過 IP 別名的心跳檢測時,通信接口的基本/啟動 IP 地址由不由RSCT 拓撲服務(從而由 HACMP)進行監視。通信接口將通過所分配的 IP 別名接受監視。

即使使用此技術,HACMP 仍然要求網絡上的所有接口(所有節點中的接口)能夠彼此通信(能夠彼此看到對方的 MAC 地址)。

用於 IP 別名的子網掩碼與用於服務 IP 地址的子網掩碼相同。在定義用於信號檢測的 IP 地址時,必須指定要用於信號檢測的起始地址,並且必須確保有足夠多與網絡上使用的現有子網不發生衝突的子網可用(節點中的每個物理通信接口對應一個子網)。


熱門標籤