Windows群集管理界面无法启动

王哥哥 错误解决 6,126 次浏览 没有评论

 

问题描述

前天是小年夜,尼玛然后下午在scvmm里看到很多群集节点一会显示发现关闭的节点,一会显示发现开启的节点,然后检查了半天,和微软的工程师联系他们说打下补丁,发了一堆群集的补丁列表,基本上次出问题都打过了,然后就尝试把机器都轮流重启一次,重启到凌晨5点受不了了,睡了会,到了九点的时候,别的使用的同事来电话问虚拟机是不是出问题了,然后又起来看了下,尼玛的监控上面一片红,n多宿主机的给虚拟机用的网卡down了,我一想不对肯定交换机出问题了,马上联系我同事,果然交换机上联端口出问题了,急急忙忙赶到公司,日啊,大年夜在公司过了要,然后换了交换机,发现群集还是起不来,群集不能起来我的虚拟机资源不够,也没法都起来,好不容易找了微软的高级工程师,大家要上大的项目记得要买微软的Premier服务,否则大过年的工程师都不在了内心一万个草泥马飘过。

问题现象

这时在节点上连接群集会报下面的错误


执行命令import-module failoverclusters #powershell中导入群集的命令

然后执行get-cluster也报错,服务里的群集服务起来了,但是群集连不上


执行 get-clusternode #查看群集节点

可以看到大部分节点down了,坏的节点占了大多数,使用我们的群集管理界面无法启动

解决思路

群集服务不能联机很多时候是dns出问题,ping节点ip的时候返回的ip不对了,会造成这个问题,所以先检查ip的原因,然后如果ip什么没问题,像我现在的问题是因为群集的多数节点down了,坏的节点占了多数导致起不来,所以就到那些坏了的机器上面禁用cluster服务,禁用之后等于他们退出群集了,这时正常的节点占了多数群集就会又起来了。

 

解决过程


我们检查了群集网络,DNS,网络包没有发现异常,本机HOST文件无异常。


 

我们运行get-cluster 命令,将无法获取的群集信息的节点的群集服务暂时禁止。


关闭无法正常获得节点的群集服务


 

在正常节点上,使用如下命令强制启动群集服务:

Net stop clussvc

Net start clussvc /fq

 

强制启动后,我们可以正常连接群集,将其他节点群集服务启动,加回群集。

 

Force Quorum in a Single-Site or Multi-Site Failover Cluster 

https://technet.microsoft.com/en-us/library/dd197500(v=ws.10).aspx

 

 

发表回复

Go