上午10点左右,我与几个项目参与人驱车将 Dell 工程师接到地点,因为硬件方面与 Dell 有着良好的合作关系,所以情理之中。

      在工程师的初步检查后,开始做备件替换工作,折腾了半天,没辙!不得不把服务器从机架上撤下来,又是耗费不少时间。整个替换过程一直持续到下午4点左右,我们才去吃了中午饭,呵呵!具体被替换的部件有:I/O Base板、光软一体化模块、一颗2.7G的志强CPU、一块CPU稳压模块。呵呵!下面是几张他们在工作时我照得照片。

      Dell服务器从机柜上被拿下,费了我们几个人不少力气,因为早期安装时工程人员没有完全地将服务器安装在架上,其中一个卡扣没有挂到槽里。

    拆掉 I/O 端口子卡、RAID卡,竟然还有一块D-Link的无限网卡,呵呵!真够绝的,我说怎么机箱里还会有天线。之后将 I/O Base 基板模块箱取出。真够脏的,还不是一般的脏!

      更换 I/O Base 基板

    在 I/O 基板更换完毕后,我们将服务器恢复到了机架上,也不是那么容易哦!开机发现面板状态显示还是有故障,拔掉 RAID 卡后启动正常,拆除 RAID 卡上的 Cache ,只插上 RAID 卡,机器启动正常,不排除 RAID  卡整个可能存在问题及隐患,之后干脆决定不使用 RAID 卡,直接将磁盘组挂接到板载 SCSI 控制器上,之后采用软 RAID 的方案。

      现在还要解决 CPU 过热的问题,根据工程师的建议和我们的要求不再做排错,直接替换 CPU 和其专属的那块稳压卡,摘掉内部的六个散热风扇及打开相关的固定位,拆下了 CPU 板。

    照片中替换的就是报错的第一颗CPU,提示过热,所以我们直接更换。并将CPU前端的稳压模块也替换掉。以免后患。拆装过程中,工程师顺带清理了散热片,GOD,那灰尘堆积如山,怪不得会热。按照我的分析CPU应该问题不大,清理灰尘后应该就可以恢复正常,不过 Dell 工程师还是建议我们更换掉,Dell 的服务真的值得我们信赖。真的不是在做广告。

    图中的兄弟正在更换硬盘将4块300G的SCSI硬盘替换掉之前的老硬盘。桌上放着的是两块内存板子模块,我去动它,以免堆积的泥尘移位导致它在出现故障,看来服务器的清理还是很有商机的,一些科技市场里自称是高科技的 “IT精英”和 “倒爷们”可以考虑一下。真正敬职敬业的人士不在我调侃对象中。言语过激还请见谅,这几天去转了一圈科技市场,面对那些新上来的 IT 届年轻人,我真感到心痛!

    全部完毕后,机器终于正常了,合上顶盖开启机器,面板灯恢复了正常程蓝色背景。开机自检速度非常慢,但是没有报错,我便没有在意,开始安装系统一些正常。之后在系统中配置软 RAID,首先将磁盘转换为动态磁盘,正常。之后创建 RAID0,格式化中突然中断,提示磁盘1有错误,重新激活删除卷再次配置格式化还是错误,分析日志发现 SCSI 卡传输错误,疑是硬件问题,迅速关机检查磁盘1。果不其然,拔下硬盘后发现接口中有包装杂质存在,这个可是不应该的。Faint,解决后插入硬盘发现自检还是非常慢,2003系统启动到 Logo 处死机。就这样整个系统算是白撞了,之后更换了几块硬盘还是有问题,调换位置、逐样测试我们几个人都要崩溃了!后来又更换了硬盘终于机器正常了,再次开机自检非常顺利很快就过去,硬盘检测通过,背板上的通道也能够被识别出,按照 Dell 工程师来说这才是最正常的。

      重新安装了系统,配置了软RAID0,整个事件也就1个小时左右。我的工作才真正地完成。当然离不开所有的工作人员,这里我要感谢我的爸爸、我的妈妈、Dell 公司、微软 公司、各位同仁…………,哈哈,别打我!!

      晚上近7点左右返回住所,整个项目便告以段落。可以好好休息休息!真是折腾人,因为后来一些工作人员撤离后,现场就剩下我,我还点作收尾工作。发现现在体力真是不行,连个机柜的门搬起来都很吃力!

天天琐记 | 评论(1) | 引用(292) | 阅读(4269)
发表评论
昵称 [注册]
密码 游客无需密码
网址
电邮
打开HTML 打开UBB 打开表情 隐藏 记住我