app教程网 学习教程 服务器常见故障处理(服务器故障处理流程图)

服务器常见故障处理(服务器故障处理流程图)

一、服务器无法启动的主要原因:

电源或电源线故障(断电或接触不良)

电源或电源模块故障。

记忆故障(通常伴有警报声)

CPU故障(一般会有警报声)

主板故障

其他卡引起的中断冲突。

二、服务器启动不了?

检查电源线和各种I/O线是否连接正确。

连接电源线后检查主板是否通电。

把服务器设置到最低配置(只有一个cpu,最少内存,只有显示器和键盘)直接短接主板的开关跳线,看能不能启动。

检查电源,拔掉所有电源接头,将电源的主板供电口的绿线和黑线短接,看电源是否启动。

如果判断供电正常,就要用更换的方法排除故障。更换方法是在最低配置下更换最容易更换的配件(内存、cpu、主板)(本文转自河南www.hnsjhf.cn数据恢复网)。

三、系统重启频繁?

系统频繁重启的原因:

停电(替代法判断和解决)

内存故障(可以从BIOS错误报告中检测到)

网络端口数据流量过大(工作压力过大)

软件故障(通过更新或重新安装操作系统解决)

四、服务器崩溃故障判断处理:

服务器死机故障很难判断,一般分为软件和硬件两个方面:

软件故障

硬件故障

软件故障

首先,检查操作系统的系统日志,它可以用来确定一些崩溃的原因。

计算机病毒的起因。

系统软件的bug或漏洞导致的死机,需要在判断硬件无故障后做出,需要软件提供商提供帮助。

软件使用不当或者系统工作压力过大,可以要求客户适当降低服务器的工作压力,看能否解决。

硬件故障

硬件冲突

通过比较和计算服务器电源的所有负载功率的值,可以判断电源故障或电源不足。

硬盘故障(通过扫描硬盘表面检查是否有坏磁道)

内存故障(可以通过主板BIOS中的错误报告和操作系统中的错误信息来判断)

主板故障(通过更换方法判断)

CPU故障(使用替换方法)

板卡故障(一般SCSI/RAID卡或其他pci设备也可能导致系统崩溃,可以通过更换的方法判断和处理)

注意:系统死机故障处理后需要在一定压力下测试一段时间,检查故障是否彻底解决。

5.安装操作系统时提示找不到硬盘?

失败原因:

没有物理硬盘设备

硬盘电缆连接问题

硬盘控制器驱动程序未安装或驱动程序不匹配。6.怎么搞定司机?

使用随机光盘制作相应的驱动器。

7.为什么我不能用正确的驱动程序加载硬盘控制器驱动程序?

检查hostraid功能是否已启用。

八、一个新买的硬盘,安装在机器上,机器自检失败?

拆下新硬盘,机器是否能通过自检;

检查新添加硬盘的ID号是否与原硬盘的ID号相同。如果硬盘的ID号相同,则自检失败。

九、SCSI硬盘如何格式化?

如果有操作系统:使用磁盘管理工具格式化;

无操作系统的情况:在SCSI管理控制界面格式化;

以ADAPTEC Raid卡为例:开机-出现CTRL+A 信息时,按CTRL+A进入-选中通道A

-选中SCSI UTILITY-将检测到硬盘-选中要检测的硬盘

-选中FORMAT可对硬盘进行全面格式化

选中VERIFY可对硬盘进行检测,检查是否有坏道

注意:在格式化硬盘时不能中断或停电,不然会损坏磁盘

十、在Aisino 系列中有RAID卡机器,当其中一个硬盘不能正常工作RAID报警,但系统能正常运行,怎么办?

用一个新硬盘,确保容量大于或等于不能正常工作的硬盘,最好用相同型号的硬盘替换即可。

 RAID卡相关常见故障

第一类: RAID卡本身有问题

经常表现为RAID信息丢失,硬盘经常掉线,不能做REBUILD,开机自检时检测不到硬盘或时间长。

典型故障A:

作完RAID1,安装操作系统,一切正常,但第二次重启系统时,发出报警声,经检查发现一块硬盘掉线,REBUILD后,又恢复正常,但重启后又掉线。怀疑为硬盘故障,校验硬盘后均无问题。最后更换RAID卡,

故障解决。

典型故障B:

机器经常死机,且有时候启动速度非常慢。观察系统日志,发现在系统启动时有这样一个错误提示:设备/devices/scsi/port0 在传输等待的时间内没有响应。更换RAID卡后,恢复正常。

第二类: 硬盘本身问题

表现为硬盘掉线,在RAID阵列中的状态为DEAD,或者在作REBUILD时,作到某一进度就不能继续

典型故障:

硬盘掉线后,做REBUILD时,作到20%时出现错误提示无法继续进行。在确认掉线硬盘,硬盘盒及SCSI电缆都能正常工作后,对在线硬盘进行校验,发现有坏道,修复硬盘,重做REBUILD,恢复正常。

第三类: 硬盘盒或模组的接触问题

此类问题经常表现为RAID卡根本检测不到硬盘,此类问题比较简单,但在处理硬盘盒相关机器时,需要注意一些问题。

典型故障:

RIAD卡中检测不到硬盘,把SCSI电缆接到主板的ULTRA160接口上,故障依旧,拔出硬盘盒(不包括硬盘盒后面的托架)更换,故障依旧,更换硬盘,还是不行。最后卸下硬盘盒后面的托架(非热插拔部分),

发现后托架上80PIN接口上的一根针弯曲,校直弯针,恢复正常。

十一、在服务器上使用的SCSI硬盘,为什么硬盘的ID号不能设置为7?

SCSI控制器中,默认将ID=7设置为硬盘控制器占,所以硬盘的ID号不能设置为7

十二、为什么开机自检无法通过?

解决方法:

机器切断电源,将机箱打开,用“COMS CLEAR”跳线的跳线帽将“COMS CLEAR”跳线的另外两个针短接(跳线参看主板说明书)

机器加电,自检,等机器自检完闭,报CMOS已被清除,然后将机器电源关掉,把跳线复原即可

机器重新开机

十三、物理内存插槽报错

解决方法:

开机-按F2进入“SETUP”-“ADVANCED”--“MEMORY CONFIGURATION” 回车-“CLEAR DIMM ERRORS” 直接回车

十四、为什么处理器报错或自检过程中只找到一个处理器?

解决方法:

开机--〉按F2键,进入'SETUP'

1、依次'MAIN' --〉'PROCESSOR' --〉'CLEAR PROCESSOR ERRORS [ ]' :将此选项值设置为'YES' ;

2、依次'ADVANCED ' --〉'RESET CONFIGURATION DATA [ ] ':将此选项的值设置为' YES' ;

3、依次'SERVER ' --〉'PROCESSOR RESET [ ] ':将此选项的值设置为' YES' ;

4、依次'SERVER ' --〉'SYSTEM MANAGEMENT ':回车--〉 'CLEAR EVENTLOG [ ] ' :将此选项的值设置为' YES'

5、按F10,保存退出

本文来自网络,不代表本站立场,转载请注明出处:https: