xiaowuhello
故障转移测试

七、故障转移测试 前面说了这么多,终于等到最激动人心的时刻了。在这一环节中,我准备将测试分为初级测试和高级测试两块来验证群集的故障转移功能。

1、初级测试 (1) 打开群集管理器,从图中我们可以看出,目前数据共享磁盘的所有者是ClusterNodeA,状态为联机。

(2) 右键选择组0的“属性”,再选择“移动组”。

(3) 可以看到此时的状态为“脱机挂起”。

(4) 从图中可以得知,共享数据磁盘R的所有者已经转移到ClusterNodeB上了,状态为联机。

(5) 此实验说明,在群集服务中,资源能够从一个节点手动转移到另一个节点。(当然也能够自动转移,后面的实验均属于自动转移)

2、高级测试 (1) 手工模拟故障1次 (1) 打开群集管理器,对磁盘Q进行一次“初始故障”操作。此时磁盘Q的所有者为ClusterNodeA。

(2) 可以看到磁盘Q已经联机挂起了。

(3) 经过很短的时间后,磁盘Q又自动联机了,所有者还是ClusterNodeA。

(4) 此实验说明,群集节点的资源,在遇到初始故障后,能够自我修复,重新回到联机状态。虽然在这个实验中没有体现出能够初始故障多少次,但是我可以告诉大家,是3次。如果初始故障次数超过3次,就不会自我修复了,而是会进行故障转移。下面的实验会证明这一点。

(2) 手工连续模拟故障4次 (1) 打开群集管理器,对磁盘R进行“初始故障”操作,重复4次。此时磁盘R的所有者还属于ClusterNodeA。

(2) 4次模拟故障后,定位到“资源”,在右边窗口中可以看到,所有资源已自动迁移到ClusterNodeB上,处于联机状态。

(3) 由于心跳侦测机制的作用(心跳信息大约每1.2秒一次),群集服务会发现ClusterNodeA并不是真正的宕机,所以ClusterNodeA会自动尝试联机。

(4) 节点ClusterNodeA已恢复正常。

(5) 此实验说明,在群集服务中,当某个节点故障超过3次后,则不会自动恢复,而是进行故障转移。同时也说明,当群集服务检测到原节点可用时,原节点会再次自动回到群集中。此过程的专业术语叫“故障回复

(3) 停止群集服务测试