Cisco B200 M3刀片服务器Discovery失利毛病处理51CTO博客 - 威尼斯人

Cisco B200 M3刀片服务器Discovery失利毛病处理51CTO博客

2019年03月08日08时14分23秒 | 作者: 元瑶 | 标签: 刀片,服务器,毛病 | 浏览: 1527

客户刀片服务器晋级,购买了两台Cisco B200 M3,到货后咱们检查了一下B200 M3的版别,然后对UCS Manager进行了晋级,但是晋级完之后发现这两台刀片服务器在Discovery进程中,只走到了7%就失利了!如下图所示:

别的,检查报警信息和思科文档如下:

看上图的文档也没有得到有用的信息。问题终究出在哪里?为了进一步求证,咱们做了如下操作:

1、取下刀片服务器,只装置一颗CPU和一条内存。在这种状态下服务器能够discovery经过。

2、装置两颗CPU和两条内存,此刻毛病现象仍旧,仍是无法经过。

3、将CPU1和CPU2对换,CPU2是独自下单的,CPU1是随刀片一同过来的,只装置CPU2和一条内存了,discovery进程能够经过。

4、将原有的一台B200 M3的内存悉数拆下和现有内存交换,装置两颗CPU,discovery进程仍是无法经过。

5、只在CPU2的槽位上装置一颗CPU和一条内存,依然不可(后来得知,在只要一颗CPU的情况下,只能插在CPU1槽1上)

6、将刀片替换槽位,也不可……

7、Recover,也不可……

………………

试了种种依然不可,初步判别问题或许是出在主板上,所以带着这个疑问向思科开了一个case,后来思科TAC工程师收集了一下日志,依据日志判别问题也或许出在主板上。终究帮咱们做了一个RMA,重新发两块主板过来!

等待总是夸姣的,可那究竟仅仅等待!

待RMA的两块主板抵达后,咱们把CPU、内存等部件插好后,刺进刀箱,见鬼的工作再次呈现了,discovery进程依然是走到7%就不动了!两块都是这样!

感觉不符合常理,但是问题仍是呈现了!

咱们将呈现的问题报告给了大BOSS,大BOSS也深感疑问,不或许发来的都是坏的啊!所以元旦后的榜首天大BOSS亲临现场。

大BOSS经过一翻检查,发现这两台刀片的boardcontroller的firmware没有显现版别显现,也就是看不出来是什么版别,会不会是由于这个导致的问题呢?所以经过SSH登录UCS Manager,进行了如下操作:

C6248A-A# scope chassis 2
C6248A-A /chassis # scope server 6
C6248A-A /chassis/server # scope boardcontroller
C6248A-A /chassis/server/boardcontroller # activate firmware 14.0
Warning: When committed this command will reset the end-point
C6248A-A /chassis/server/boardcontroller # commit-buffer 

待刀片再次发现时居然经过了那个7%,直至发现成功!至此,RMA过来的那两台刀片所呈现的问题得以处理!

大BOSS出马,哇嘎嘎……(*^*)


两台刀片正常之后,咱们在想别的两台是不是也是由于这个原因呢?所以咱们再一翻折腾,把本来的一台刀片服务器再次刺进刀箱,进行检查。但是事于愿违,终究不得不将毛病刀片发走!

**********************************************************************************************

总结:

1、毛病处理必需要仔细,不能放过每一个环节。

2、不要用惯性思想对待每一个毛病,猪是撞到树上死的,但是兔子纷歧定是撞到树上死 。我和搭档在对待RMA的刀片上就犯了这个过错。

3、处理毛病时要把工作缕顺了!一点点来,一步步走!


版权声明
本文来源于网络,版权归原作者所有,其内容与观点不代表威尼斯人立场。转载文章仅为传播更有价值的信息,如采编人员采编有误或者版权原因,请与我们联系,我们核实后立即修改或删除。

猜您喜欢的文章