前段时间就发现一台服务器无故意外关机,而且帐户登录时速度非常慢,之前这台机器出现过磁盘坏道,并更换了硬盘,最终选择了重新安装系统来解决,系统安装和使用中都无发现问题,但是在运行一段时间后,又出现意外关机,并且最近非常频繁。之前拔掉多余供电发现问题并没有很好的改善,实在找不出原因,日志中没有任何可以的记录,只是中间出现过刚开机自检时就断电!之后又恢复了配件供电。

      今天决定把所有配件电源拔掉,在检查过程中发现发现登录时又出现特别缓慢的现象跟之前出现的问题一致,突然系统就蓝屏了!这是多么可贵的一次蓝屏要知道没有这个蓝屏根本无法找到定位故障点!随后对双通道内存进行插拔测试,可疑一根内存可能存在问题,可是使用单内存运行登录缓慢现象解除,于是再测试另外的内存,没有发现此现象,开始怀疑原装内存的胶封有问题,于是更换插槽启用双通道开机测试故障消除,但是意外关机的问题综合之前的排查可能并没有彻底解决,为了得到最终的答案,决定更换内存插槽,拔掉所有额外配件电源,运行测试!

      总结,之前出现的种种迹象如:磁盘逻辑坏道、登录时用户配置文件载入缓慢、意外关机可能都跟内存有关!监视继续……

天天琐记 | 评论(2) | 引用(0) | 阅读(3393)
gOxiA
2006/07/24 14:25
经过这几天的监测与机房工作人员的反馈,我发现意外断电的主要原因是因为过热造成的,之前因为将主板中的温度监控关闭所以一直没有意识到是温度造成,之后也对电源的老化做过估计,可是并没有想到解决了散热后就解决了这个故障,电源内部过热造成的意外断电是此次事件的罪魁祸首。目前服务器已经进入了正常运行状态。
gOxiA
2006/07/21 16:09
更换内存后今天又发现出现意外关机的问题,心里害怕千万别多个配件同时出问题,看来是应验了!这样一来就给排障添加很多困难,毕竟服务器在运营中。新服务器已经马上要上架,希望尽快能够迁移过去。目前就差主板和电源两个部分,再坚持一下!我一直ping着服务器倒是没出现故障,郁闷……
分页: 1/1 第一页 1 最后页
发表评论
昵称 [注册]
密码 游客无需密码
网址
电邮
打开HTML 打开UBB 打开表情 隐藏 记住我