zoukankan      html  css  js  c++  java
  • [原]鄙视一下联想服务器

    只会叫的万全R350

        今天巡检机房的时候发现一个机柜里面传来了“嘀嘀嘀嘀嘀”的报警声,马上观察每台服务器的故障灯,未见异常,凑耳朵去听,终于把问题定位到了一台联想万全R350的服务器上,登录到服务器上检查,没有发现异常。
        这个现象让我想起3年前这台服务器的一次故障,当时也是如此报警,故障灯不亮,经过相当仔细的观察,有一个硬盘的读写灯始终不亮,排除Hot-Spare的情况,怀疑是硬盘故障,通知联想工程师到场检测,现场的联想工程师也不确定,不过比较赞成我的看法。重启服务器进入RAID卡的WEB BIOS,从RAID卡的检测确认的确是有一块硬盘损坏,但是编号确指向一个空的硬盘插槽……。于是关机,开盖,找到RAID卡和SAS连接线,一条条排查,终于确认的的确确是那块读写灯不闪的硬盘损坏了。

        参考3年前的经历,俺在服务器上做了一个大的I/O操作,观察读写灯,确认一块硬盘读写灯的确不亮,大胆地换下这块硬盘,事实证明我“猜”对了(硬盘做RAID 5 一旦弄错硬盘系统马上崩溃)。

        该台服务器是2007年3月份购买的,到今天坏硬盘为止刚好超出保修期3个月,3月份曾向联想询问续保的事情,可得到的答复是——“没有备件,不卖续保”,上个月发现R350的一个电源模块坏掉了,联想以超过保修期为由不更换,莫非联想已经算好“三年一过,必有灾祸”?咋不预测一下世界杯呢?

    沉默的万全R525

        联想的大忽悠来俺们这推销服务器,最后动情地说了一句:“那么多DELL的服务器,却没有一台联想的服务器,支持一下民族品牌吧”(其实真有一台,就是上面说的那台R350),领导想想也对,于是下命令采购4台,俺们老大一百个不愿意,于是使了个小心眼把配置写得高高的,当时联想的网站上根本找不出这么高配置的机型,谁知联想还真的能供货,就此买了4台万全R525,当时联想的大忽悠还说:“这可是全国第一批这样的服务器,我以前都没见过”,一看序列号,最后一位分别是5、6、7、8,也许还真是那么回事。没几天,一个阴差阳错的机会向DELL询价,也是同样的配置,报价竟然比联想还便宜,唉,支持民族品牌,人人有责。

        故事还没完,不愧是第一批R525,问题太多了。

        有一天发现1台R525的一个主板上网口不通,排除网线问题,通知联想上门,最后定位为网口问题,换主板;没几天另一台机器也是这样,换主板……。4台机器有3台坏了主板上的网口,其中1台换了主板后没过1个月又坏了网口,再换。3个月内4次网口损坏,换了4块主板。幸好联想还是比较遵守国家三包政策的。

        坏网口这个问题挺奇怪的,故障灯不亮,也不叫,就是死活ping不通网络,一开始以为是网线问题,连续换了11条网线才确定是网口问题,即使是PC机也就打雷或者怒砸才有可能坏网口,俺们咋就那么幸运呢?

        又有一天发现一台R525亮红色报警灯,围着它转了三圈没发现任何问题,让联想工程师上门检测,用一个程序读取BMC芯片的日志,也没发现什么问题,于是刷BIOS,还是亮红灯;拆开换主板,刷BIOS,还是亮;拆开换RAID卡,刷BIOS,还是亮;折腾了三天,螺丝都快折了,还是亮红灯。俺调侃地跟联想工程师说:“是不是风扇坏掉了”,于是打开机箱盖开机,仔细观察,的确是有一个风扇不转了,赶紧调货,换风扇,开机后还是亮,刷BIOS,终于不亮了。找知道当时在人品爆发爆发的时候就预言一下双色球啦-_- 。

        故障的定位能力也是服务器的一个很重要的指标,希望大家选购时要重视这项指标,不建议选购那种只有一个故障灯的服务器。

  • 相关阅读:
    小程序裁剪图片上传头像,二维码源码
    算法随笔
    背景色根据数值由深到浅
    jquery 点击弹框
    css3
    HTML5中手势原理分析与数学知识的实践
    es6(var,let,const,set,map,Array.from())
    taro3.0 Swiper album example
    taro3.x: 搭建redux环境
    taro: fial cannot navigate back at first page
  • 原文地址:https://www.cnblogs.com/killkill/p/1776123.html
Copyright © 2011-2022 走看看