下午好,我的网工朋友。
服务器不论是硬件结构还是运行系统,都与我们平常用的电脑相类似。
但服务器的作用是支撑着整个企业的信息数据,一般是很少出现问题的,但一旦出现问题,则会大范围的影响企业的正常运营。
了解常见故障及相应的排查方法对于保障服务器正常运行还是很重要的。
今天来探讨一下12种基本故障及排查方法,及时发现问题并采取正确的措施,才可以最大程度地减少服务器故障给业务带来的影响。
今日文章阅读福利:《 华为机架服务器白皮书 》
给你分享一份华为厂商的某机架服务器白皮书,进一步观察学习相关硬件部件知识。私信我,发送暗号“机架服务器”,即可获取。
01 加电类故障
01 定义举例
从上电(或复位)到自检完成这一段过程中电脑所发生的故障。
02 可能的故障现象
1、 主机不能加电(如:电源风扇不转或转一下即停等)、有时不能加电、开机掉闸、机箱金属部分带电等;
2、 开机无显,开机报警;
3、 自检报错或死机、自检过程中所显示的配置与实际不符等;
4、 反复重启;
5、 不能进入BIOS、刷新BIOS后死机或报错;CMOS掉电、时钟不准;
6、 机器噪音大、自动(定时)开机、电源设备问题等其它故障。
03 可能涉及的部件
市电环境;电源、主板、CPU、内存、显示卡、其它可能的板卡;BIOS中的设置(可通过放电来回复到出厂状态);开关及开关线、复位按钮及复位线本身的故障。
04 判断要点/顺序
以下的文字叙述部分是对维修判断流程的补充和说明,要结合流程图来阅读。
另外,本章只分析加电类的故障,如果在判断中涉及其它类故障,可转入相应故障的判断过程。以下各类同。
1、 维修前的准备
1) POST卡;
2) 万用表;
3) 试电笔;
4) CPU负载。
2、 环境检查
1) 检查电脑设备:
A. 周边及电脑设备内外是否有变形、变色、异味等现象;
B. 环境的温、湿度情况;
C. 加电后,注意部件、元器件及其它设备是否变形、变色、异味、温度异常等现象发生。
2) 检查市电情况:
A. 检查市电电压是否在220V±10%范围内,是否稳定(即是否有经常停电、瞬间停电等现象);
B. 市电的接线定义是否正确(即,左零右火、不允许用零线作地线用(现象是零地短接)、零线不应有悬空或虚接现象);
C. 供电线路上是否接有漏电保护器(且必须接地火线上),是否有地线等;
D. 主机电源线一端是否牢伤心地插在市电插座中,不应有过松或插不到位的现象,另一端是否可伤心在接在主机电源上,不应有过松或插不到位的情况。
02 启动与关闭类故障
01 定义举例
与启动、关闭过程有关的故障。启动是指从自检完毕到进入xx作系统应用界面这一过程中发生的问题;关闭系统是指从点击关闭按扭后到电源断开之间的所有过程。
02 可能的故障现象
1、 启动过程中死机、报错、黑屏、反复重启等;
2、 启动过程中报某个文件错误;
3、 启动过程中,总是执行一些不应该的xx作(如总是磁盘扫描、启动一个不正常的应用程序等);
4、 只能以安全模式或命令行模式启动;
5、 登录时失败、报错或死机;
6、 关闭xx作系统时死机或报错。
03 可能涉及的部件
BIOS设置、启动文件、设备驱动程序、xx作系统/应用程序配置文件;电源、磁盘及磁盘驱动器、主板、信号线、CPU、内存、可能的其它板卡。
04 判断要点/顺序
1、 维修前的准备
1) 磁盘数据线;
2) 万用表;
3) 查毒软件。
2、 环境检查
1) 机器周边及外观检查:
A. 市电连接是否牢伤心,不应有过松或插不到位的现象;
B. 主机硬盘指示灯是否正确闪亮,不应有不亮或常亮的现象;
C. 观察系统是否有异味,元器件的温度是否偏高;
D. 观察CPU风扇的转速是否不够,或是否过慢或不稳定;
E. 倾听驱动器工作时是否有异响。
2) 驱动器连接检查:
A. 驱动器的电源连接是否正确、牢伤心。驱动器上的电源连接插座是否有虚接的现象;
B. 驱动器上的跳线设置是否与驱动器连接在电缆上的位置相符;
C. 驱动器数据电缆是否接错或漏接,规格是否与驱动器的技术规格相符(如:支持DMA66的驱动器,必须使用80芯数据电缆);
D. 驱动器数据电缆是否有故障(如露出芯线、有死弯或硬痕等),除可通过观察来判断外,也可通过更换一根数据电缆来检查;
E. 驱动器是否通过其它板卡连接到系统上,或通过其它板卡(如硬盘保护卡,双网隔离卡等)来控制。
3) 检查其它部件的安装:
A. 通过重新插拔部件(包括CPU、内存),检查故障是否消失(重新插拔前,应该先做除尘和清洁金手指工作,包括插槽)。如果总是通过重新插拔来解决,应检查部件安装时,是否过松、后档板尺寸是否不合适、插座太紧,以致插不到位或被挤出;
B. 检查CPU风扇与CPU是否接触良好。最好重新安装一次。
4) 显示的内容的观察:要注意屏幕报错的内容、死机的位置,以确定故障可能发生的部位。
3、 故障判断要点
1) 充分地与用户沟通,了解出现不能启动的过程及用户的xx作;
2) BIOS设置检查:
A. 是否为刚更换完不同型号的硬件。如果主板BIOS支持BOOTEasy功能或BIOS防写开关打开,则建议将其关闭,待完成一次完整启动后,再开启;
B. 是否添加了新硬件。这时应先去除添加的硬件,看故障是否消失,若是,检查添加的硬件是否有故障,或系统中的设置是否正确(通过对比新硬件的使用手册检查);
C. 检查BIOS中的设置,如:启动顺序、启动磁盘的设备参数等。建议通过清CMOS来恢复;
D. 检查是否由于BIOS问题(包括设置及功能)引起xx作系统不能正常启动或关闭,可偿试将Windows目录下的BIOS.vxd(或VPBIOSD.vxd)改名为BIOS.old,然后重启,或关闭.
若故障消失,则通过修改BIOS设备或更新BIOS来解决,否则与BIOS无关。注意测试完成以后,一定要将其改回原来的名字(注:除Windows 98外,其它xx作系统无此文件);
E. 在某些特殊情况下,应考虑升级BIOS来检查。如:对于在第一次开机启动后,某些应用或设备不能工作的情况,除检查设备本身的问题外,就可考虑更新BIOS来解决。
以下检查应在软件最小系统下进行。
3) 磁盘逻辑检查:
A. 根据启动过程中的错误提示,相应地检查磁盘上的分区是否正确、分区是否激活、是否格式化;
B. 直接检查硬盘是否已分区、格式化;
C. 加入一个其它无故障的驱动器(如软驱或光驱)来检查能否从其它驱动器中启动(若使用软驱,最好使用希捷的检测软盘启动)。
若能,进行第3)、4)步的检查,否则进行第5)步的检查;接着、分区是否激活、有无坏道等;
D. 硬盘上的启动分区是否已激活,其上是否有启动时所用的启动文件或命令;
E. 检查硬盘驱动器上的启动分区是否可访问,若不能,用相应厂商的磁盘检测程序检查硬盘是否有故障。有故障,更换硬盘;在无故障的情况下,通过初始化硬盘来检测,若故障依然存在,更换硬盘;
F. 在用其它驱动器也不能启动时,先将硬盘驱动器去除,看是否可启动,若仍不能,应对软件最小系统中的部件进行逐一检查,包括硬盘驱动器和磁盘传输的公共部件——磁盘接口、电源、内存等。若可启动了,最好对硬盘进行一次初始化xx作,若故障不消失,则再更换硬盘;
G. 如果要对硬盘进行初始化xx作,但用户存有有用数据,建议用户找数据修复公司解决。
4) xx作系统配置检查:
A. 对于出现文件错误的提示,应按照在第一部分中提到的相应软件调试方法来修复文件;
B. 在不能启动的情况,建议进行一次“选择上一次启动”或用scanreg.exe恢复注册表到前期备份的注册表的方法检查故障是否能够消除;
C. 检查系统中有无第三方程序在运行,或系统中不当的设置或设备驱动引起启动不正常。在这里特别要注意Autoexec.bat和Config.sys文件,应屏蔽这两个文件,检查启动故障是否消失;
D. 检查启动设置、启动组中的项、注册表中的键值等,是否加载了不必要的程序;
E. 检查是否存在病毒。要求在一个系统中,只能安装一个防病毒软件;
F. 必要时,通过一键恢复、恢复安装等方法,检查启动方面的故障;
G. 当启动中显示不正常时(如黑屏、花屏等),应按显示类故障的判断方法进行检查,但首先要注意显示设备的驱动程序是否正常、显示设置是否正确,最好将显示改变到标准的VGA方式检查。
5) 硬件部件检查:
A. 如果启动的驱动器是通过另外的控制卡连接的,请将驱动器直接连接在缺省的驱动器接口(主板上的);
B. 当在软件最小系统下启动正常后,应逐步回复到原始配置状态,来定位引起不能正常启动的部件;
C. 要注意检查电源的供电能力,即输出电压是否在允许的范围内,波动范围是否超出允许的范围(参见《维修工具使用手册》);
D. 驱动器的检查,可参考磁盘类故障的判断方法进行;
E. 硬件方面的考虑,应从内存开始考虑:使用内存检测程序进行判断内存部分是否有故障,内存安装的位置,应从第一个内存槽开始安装,对于安装的多条内存检查内存规格是否一致、兼容等。
有关内存规格请参阅附录二的相关部分。
6) 对于不能正常关机的现象,应从下列几个方面检查:
A. 在命令提示符下查看BOOTLOG.TXT文件(在根目录下)。此文件是开机注册文件,它里面记录了系统工作时失败的记录,保存一份系统正常工作时的记录,与出问题后的记录相比较,找出有问题的驱动程序。
在WIN.INI SYSTEM.INI 中找到该驱动对应的选项,或在注册表中找到相关联的对应键值,更改或升级该驱动程序,有可能将问题解决;
B. 升级BIOS到最新版本,注意CMOS的设置(特别是APM、USB、IRQ等);
C. 检查是否有一些系统的文件损坏或未安装(参阅附录二之(三)的相关内容)
D. 应用程序引起的问题,关闭启动组中的应用程序,检查关机时的声音程序是否损坏;
E. 检查是否有某个设备引起无法正常关机,比如网卡、声卡,可通过更新驱动或更换硬件来检查;
F. 通过安装补丁程序或升级xx作系统进行检查;
G. 对于Windows 98SE系统的关机问题,请参阅附录二之(三)。其中的一引起论述对于其它Windows系统也有帮助。
05 本类故障的判断流程
1.案例一
问题描述:
客户计算机安装WIN 2000 PROFESSIONALxx作系统,每次启动均蓝屏,报MEMORY ERROR。
解决方案:
到达客户处,故障复现,向客户了解情况,客户反映发生故障前曾经安装过一根内存条,之后发生此类故障。
关机后拔下内存条,重新开机,仍旧蓝屏,但是不再报MEMORY ERROR。考虑到WIN 2000对硬件要求较高,而且故障是在加装内存后出现的故障,基本可以断定机器的原配硬件和软件系统没有问题。
再次重新启动计算机,开机时按下F8键,选择进入“VGA模式”,此次计算机能够正常启动,并且登陆正常。
在进行了一次正常登陆后,重新启动到标准模式,计算机启动正常,至此,故障排除。
2.案例二
问题描述:
客户机器被运行一段恶意程序,导致每次启动后均出现一个对话框,且该对话框无法关闭,只能强制结束,客户机器有重要程序,不愿意重新安装xx作系统。
解决方案:
首先怀疑是否是病毒,运行常用杀毒软件均不能查杀。在“开始”――“运行”中输入“MSCONFIG”,但是在“启动”组中仍然不能找到该程序。
运行“SCANREG”,将注册表恢复到最老的版本故障依旧。最后只好手工编辑注册表,运行“REGEDIT”,在“HKEY_LOCAL_MACHINE\Software\Microsoft\Windows\CurrentVersion\RUN下,找到对应的程序文件名,删除对应的键值后,重新启动,故障排除。
(注:建议在更改注册表前,使用注册表编辑器的“导出”功能进行注册表备份。)
03 磁盘类故障
01 定义举例
这里所指的磁盘类故障表示两个方面:一是硬盘、光驱、软驱及其介质等引起的故障;另一是影响对硬盘、光驱、软驱访问的部件(如主板、内存等)引起的故障。
02 可能的故障现象
1、 硬盘驱动器
1) 硬盘有异常声响,噪音较大;
2) BIOS中不能正确地识别硬盘、硬盘指示灯常亮或不亮、硬盘干扰其它驱动器的工作等;
3) 不能分区或格式化、硬盘容量不正确、硬盘有坏道、数据损失等;
4) 逻辑驱动器盘符丢失或被更改、访问硬盘时报错;
5) 硬盘数据的保护故障;
6) 第三方软件造成硬盘故障;
7) 硬盘保护卡引起的故障。
2、 软盘驱动器
1) 软驱指示灯不亮或常亮、软驱读盘声音大;
2) 软驱划盘、软盘不能弹出或插入等;
3) 软盘不能被格式化、软驱不读盘、软驱干扰其它驱动器或设备或应用的正常工作等;
4) 在一个软驱中写的文件不能在另一个软驱中读出;
5) 软驱盘符丢失或被更改、访问软驱时报错;
6) 软驱安装不到位。
3、 光盘驱动器
1) 光驱噪音较大、光驱划盘、光驱托盘不能弹出或关闭、光驱读盘能力差等;
2) 光驱盘符丢失或被更改、系统检测不到光驱等;
3) 访问光驱时死机或报错等;
4) 光盘介质造成光驱不能正常工作。
03 可能涉及的部件
硬盘、光驱、软驱及其它们的设置,主板上的磁盘接口、电源、信号线。
04 判断要点/顺序
1、 维修前的准备
1) 磁盘数据线;
2) 相应的磁盘检测软件;
3) 查毒软件等。
2、 硬盘驱动器
1) 环境检查
A. 检查硬盘连接:
a) 硬盘上的ID跳线是否正确,它应与连接在线缆上的位置
b) 连接硬盘的数据线是否接错或接反;
c) 硬盘连接线是否有破损或硬折痕。可通过更换连接线检查;
d) 硬盘连接线类型是否与硬盘的技术规格要求相符;
e) 硬盘电源是否已正确连接,不应有过松或插不到位的现象。
B. 硬盘外观检查:
a) 硬盘电路板上的元器件是否有变形、变色,及断裂缺损等现象;
b) 硬盘电源插座之接针是否有虚焊或脱焊现象;
c) 加电后,硬盘自检时指示灯是否不亮或常亮;工作时指示灯是否能正常闪亮;
d) 加电后,要倾听硬盘驱动器的运转声音是否正常,不应有异常的声响及过大的噪音。
C. 硬盘的供电检查:
a) 供电电压是否在允许范围内,波动范围是否在允许的范围内等。
2) 故障判断要点
A. 建议在软件最小系统下进行检查,并判断故障现象是否消失。这样做可排除由于其它驱动器或部件对硬盘访问的影响。
B. 参数与设置检查:
a) 硬盘能否被系统正确识别,识别到的硬盘参数是否正确;BIOS中对IDE通道的传输模式设置是否正确(最好设为“自动”);
b) 显示的硬盘容量是否与实际相符、格式化容量是否与实际相符(注意,一般标称容量是按1000为单位标注的,而BIOS中及格式化后的容量是按1024为单位显示的,二者之间有3%~5%的差距。另格式化后的容量一般会小于BIOS中显示的容量)。硬盘的容量根据系统所提供的功能(如带有一键恢复),应比实际容量小很多,缩小的值请参看用户手册中的相关说明;
c) 检查当前主板的技术规格是否支持所用硬盘的技术规格,如:对于大于8GB硬盘的支持、对高传输速率的支持等;
C. 硬盘逻辑结构检查:参考启动类故障判断要点中的相关部分。
a) 检查磁盘上的分区是否正常、分区是否激活、是否格式化、系统文件是否存在或完整;
b) 对于不能分区、格式化xx作的硬盘,在无病毒的情况下,应更换硬盘。更换仍无效的,应检查软件最小系统下的硬件部件是否有故障;
c) 必要时进行修复或初始化xx作,或完全重新安装xx作系统;
D. 系统环境与设置检查:参考启动类故障判断要点中的相关部分。
a) 注意检查系统中是否存在病毒,特别是引导型病毒(如用查KV3000 /K命令,或用MEM.EXE命令等进行检查);
b) 认真检查在xx作系统中有无第三方磁盘管理软件在运行;设备管理器中对IDE通道的设置是否恰当;
c) 是否开启了不恰当的服务。在这里要注意的是,ATA驱动在有些应用下可能会出现异常,建议将其卸载后查看异常现象是否消失;
E. 硬盘性能检查:
a) 当加电后,如果硬盘声音异常、根本不工作或工作不正常时,应检查一下电源是否有问题、数据线是否有故障、BIOS设置是否正确等,然后再考虑硬盘本身是否有故障;
b) 应使用相应硬盘厂商提供的硬盘检测程序检查硬盘是否有坏道或其它可能的故障;
F. 对于关于硬盘保护卡所引起的问题,应从以下几方面考虑:
a) 安装硬盘保护卡,应注意将CMOS中的病毒警告关闭、将CMOS中的映射地址设为不使用(disable)、将CMOS中的第一启动设备为设为LAN;光驱和硬盘应接在不同的IDE数据线上。
b) 如果忘记的硬盘保护卡的管理员密码,对于1.0版ALT+133,ALT+144,ALT+155,弹出10组数(必须用小键盘),对于3.0版,在管理员密码处输入ENPQ,得到一组数据,然后拨打800,来得到密码;
c) 装有硬盘保护卡的机器,开机出现红屏现象,应使用专用的工具程序解决。方法请参阅相关的《技术工程信息通报》;
d) 对于在某个引导盘下,看不到某些数据盘的情况,要检查:这些数据盘是否为该引导盘专属的数据盘;分区类型是否为引导盘的xx作系统所识别;在大于8GB的硬盘上,在8GB之后是否建立了属于该引导盘的FAT16分区(当然引导盘支持FAT16文件系统);该引导盘的专属分区是否多于3 个;
e) 硬盘保护卡不起保护功能,要检查用户是否关闭了硬盘保护功能,要启用硬盘保护功能,可在进入系统前按一下F4来启用(事先应已安装过),如果不行,可重新插拔一下硬盘保护卡。在Windows下,则应检查其驱动软件是否已安装;
f) 当启有了硬盘保护功能后,硬盘上原来的系统不被保留,应询部用户原系统是否是用第三方软件进行的分区。目前硬盘保护卡只能保护用xx作系统自带的FDISK进行分区的系统;
g) 在硬盘保护模式为每次还原,如果由于未正常关机,而出现多次提示进行磁盘扫描,应在管理员模式下,在Msdos.sys文件中加入autoscan=0的项;
h) 对于在使用者模式下,出现乱码的现象,需在管理员模式下运行升级盘中的SETUP.EXE;
3、 软盘驱动器
1) 环境检查
A. 软驱的在一定情况下,类似于硬盘的检查方法。
B. 检查软驱的连接:
a) 连接电缆安装是否正确,不应有插错或插反的现象;
b) 软驱连接的位置,应与BIOS中设置的值相符;
c) 软驱的电源连接是否正确。
C. 软驱外观检查
a) 软驱中是否有异物;
b) 电路板上及其元器件是否有变形、变色、异味等现象。
D. 所使用的软盘介质的质量是否太差;
2) 故障判断要点
A. 软驱的检查,应在软件最小系统中加入软驱,或去掉硬盘后进行检查判断。且在必要时,移出机箱外检查;
B. 类似硬盘驱动器的检查。但要注意:BIOS中对软驱是否可读写的设置是否为允许或禁止;
C. 检查软驱的读、写能力,一方面是自身读写能力的检查,另一方面是软盘的互换读写能力的检查,即在可能有故障的软驱中写过的软盘能否在另一正常的软驱中读出。如果不能,更换软驱;
D. 软盘是最易感染病毒的介质,因此的检查中,一定要注意对病毒的检查。
4、 光盘驱动器
1) 环境检查
A. 检查光驱连接:
a) 光驱上的ID跳线是否正确,它应与连接在线缆上的位置匹配;
b) 连接光驱的数据线是否接错或接反;
c) 光驱连接线是否有破损或硬折痕。可通过更换连接线检查;
d) 光驱连接线类型是否与光驱的技术规格要求相符;
e) 光驱电源是否已正确连接,不应有过松或插不到位的现象。
B. 光驱外观检查:
b) 光驱电路板上的元器件是否有变形、变色,及断裂缺损等现象;
c) 光驱电源插座之接针是否有虚焊或脱焊现象;
d) 加电后,光驱自检时指示灯是否不亮或常亮;工作时指示灯是否能正常闪亮;
e) 加电后,要倾听光驱驱动器的运转声音是否正常,不应有异常的声响及过大的噪音。
2) 故障判断要点
A. 光驱的检查,应用光驱替换软件最小系统中的硬盘进行检查判断。且在必要时,移出机箱外检查。检查时,用一可启动的光盘来启动,以初步检查光驱的故障。如不能正常读取,则在软件最小系统中检查。最先考察的是光驱;
B. 类似硬盘驱动器的检查方法;
C. 光驱性能检查:
a) 对于读盘能力差的故障,先考虑防病毒软件的影响,然后用随机光盘进行检测,如故障复现,更换维修,否则根据用户的需要及所见的故障进行相应的处理;
b) 必要时,通过刷新光驱的formware检查不驱的故障现象是否消失(如由于光驱中放入了一张CD光盘,导致系统第一次启动时,光驱工作不正常,就可偿试此方法);
D. xx作系统中配置检查:
a) 在xx作系统下的应用软件能否支持当前所用光驱的技术规格;
b) 设备管理器中的设置是否正确,IDE通道的设置是否正确。必要时卸载光驱驱动重启,以便让xx作系统重新识别。
05 本类故障的判断流程
1.案例一
问题描述:
小王是一家公司的计算机维护人员,办公用机为联想的奔月2000机型,13G硬盘,由于长时间电脑中系统和数据未进行维护,系统启动和运行都比较慢,将C盘上的重要数据复制到D盘,之后运行联想的系统恢复软件,将隐藏分区里的Windows98SE系统复制到C盘上。
10分钟不到恢复完毕,再次重新启动,正常进入Windows98系统。但是进入系统后,发现原来用PM划分的扩展分区不见了大量的数据资料都在扩展分区中,如何是好?小王陷入尴尬的境地……
解决方案:
首先查看联想机器随机资料,说明书上写着“可能对PM等的分区格式不支持,分区时请用Fdisk……”,可能是进行系统恢复时破坏了原来的硬盘分区表,有没有什么办法解决呢I诵莫机进入MSDos或者进入PM,出了一个主分区和一个扩展分区没有其他的分区信息。
这时想到软件Diskman,进入MSDos,运行Diskman,首先警告说分区表有误,Diskman虽然仍然把硬盘识别成两个分区,但它还有重新检测分区表的功能。
重新检测分区表有全自动和交互两种方式,选择后者,Diskman就开始逐柱面检测硬盘上原已存在的分区表。过了很长的时间,原有的三个分区包括联想系统恢复软件隐藏的备份分区都被检测了出来,保持分区格式,一切正常。
点评:
用户应用中或是在用户对硬盘分区时断电都会导致硬盘分区表的错误,遇到此种问题时不要着急,要分析问题的原因,查看相关的资料,如相关软件和计算机附带的资料,借助相关的软件或工具解决,若是对硬盘的工作原理、相关软件或工具的应用不是很了解,一定要查找相关资料或是向人询问。
注:Diskman硬盘分区表维护软件,运行于MSDOS环境,采用全中文图形界面,无须任何汉字系统支持。以图表的形式揭示了分区表的详细结构,支持鼠标xx作,支持8G以上的大硬盘和UNIX、NTFS等多种分区格式等。
2.案例二
问题描述:
一用户天禧二5311机型,用户反映用随机的软件NTI CD-Maker Plus中的FileCD工具格式化可擦写光盘的时候(明基CD-RW),进度很快到100%,但是没有格式化完毕的提示,强行关闭对话框也无法关闭。最后等了只得结束任务。
用NTI CD-Maker Plus刻录硬盘,刻录过程中显示刻录进度,并提示刻录完毕后,将刻录好的光盘放入光驱,提示无法识别光盘。
解决方案:
首先考虑是NTI CD-Maker中的插件FileCD的软件问题,升级NTI CD-Maker软件到V5.08,V5.13,都没能解决,升级到V5.15现象依旧,再看FileCD的版本和用户原机的FileCD的版本一样,为2.0.10后续的版本并未在擦写光盘的功能上有所改进。
考虑选用另外的刻录软件,用NERO来进行测试(版本为V5.5.9.0),用该软件执行快速擦写后再对光盘进行刻录,依旧发生上述的现象。但是用SONY的CD-RW光盘则无此问题。
点评:擦写光盘时和刻录软件及刻录机都有很大的关系,请工程师在解决问题时可以从多个角度考虑问题。
3.案例三
问题描述:
一用户光驱过保,用户自行购买光驱,据用户称在市场上购买光驱时进行测试,光驱没有任何问题,测试的数据盘和VCD等光盘都可以正常读出,但是回到家加装光驱后,开机进入系统,所有放入光驱中的碟片在驱动器的盘符上都只显示CD样的标记。用户回到购买处将光驱安装到测试机器上,问题复现。
解决方案:
经过检查发现,光驱的数据接口上一根数据线弯,导致驱动器中数据无法正常识别。
04 显示类故障
01 定义举例
这类故障不仅包含由于显示设备或部件所引起的故障,还包含有由于其它部件不良所引起的在显示方面不正常的现象。也就是说,显示方面的故障不一定就是由于显示设备引起的,应全面进行观察和判断。
02 可能的故障现象
1、 开机无显、显示器有时或经常不能加电;
2、 显示偏色、抖动或滚动、显示发虚、花屏等;
3、 在某种应用或配置下花屏、发暗(甚至黑屏)、重影、死机等;
4、 屏幕参数不能设置或修改;
5、 亮度或对比度不可调或可调范围小、屏幕大小或位置不能调节或范围较小;
6、 休眠唤醒后显示异常;
7、 显示器异味或有声音。
03 可能涉及的部件
显示器、显示卡及其它们的设置;主板、内存、电源,及其它相关部件。特别要注意计算机周边其它设备及地磁对计算机的干扰。
04 判断要点/顺序
1、 维修前的准备
相应显示卡的最新版驱动程序
2、 环境检查
1) 市电检查:
A. 市电电压是否在220V±10%、50Hz或60Hz;市电是否稳定;
B. 其余参考加电类故障中有关市电检查部分。
2) 连接检查:
A. 显示器与主机的连接牢伤心、正确(特别注意,当有两个显示端口时,是否连接到正确的显示端口上);电缆接头的针脚是否有变形、折断等现象,应注意检查显示电缆的质量是否完好;
B. 显示器是否正确连接上市电,其电源指示是否正确(是否亮及颜色);
C. 显示设备的异常,是否与未接地线有关。特别注意:不允许电脑维修工程师为用户安装地线,应请用户通过正式电工来安装;
3) 周边及主机环境检查:
A. 检查环境温、湿度是否与使用手册相符(如钻石珑管,要求的使用温度为18~40C);
B. 显示器加电后是否有异味、冒烟或异常声响(如爆裂声等);
C. 显示卡上的元器件是否有变形、变色,或温升过快的现象;
D. 显示卡是否插好,可以通过重插、用橡皮或酒精擦拭显示卡(包括其它板卡)的金手指部分来检查;主机内的灰尘是否较多,进行清除;
E. 周围环境中是否有干扰物存在(这些干扰物包括:日光灯、UPS、音箱、电吹风机、相伤心过近(50厘米以内)的其它显示器,及其它大功率电磁设备、线缆等)。注意显示器的摆放方向也可能由于地磁的的影响而对显示设备产生干扰;
F. 对于偏色、抖动等故障现象,可通过改变显示器的方向和位置,检查故障现象能否消失。
4) 其它检查及注意事项:
A. 主机加电后,是否有正常的自检与运行的动作(如有自检完成的鸣叫声、硬盘指示灯不停闪烁等),如有,则重点检查显示器或显示卡;
B. 禁止带电搬动显示器及显示器方向,在断电后的一段时间内(2~3分钟)也最好不要搬动显示器。
3、 故障判断要点
1) 调整显示器与显示卡:
A. 通过调节显示器的OSD选项,最好是回复到RECALL(出厂状态)状态来检查故障是否消失。对于液晶显示器,需按一下auto config按钮;
B. 显示器的参数是否调得过高或过低(如H/V-MOIRE,这是不能通过RECALL来恢复的);
C. 显示器各按钮可否调整,调整范围是否偏移显示器的规格要求;
D. 显示器的异常声响或异常气味,是否超出了显示器技术规格的要求(如新显示器刚用之时,会有异常的气味;刚加电时由于消磁的原因而引起的响声、屏幕抖动等,但这些都属正常现象)。有关显示器的规格,请见附录二之(二);
E. 显示卡的技术规格是否可用在主机中(如AGP 2.0卡是否可用在主机的AGP插槽中等)。
2) BIOS配置调整:
A. BIOS中的设置是否与当前使用的显示卡类型或显示器连接的位置匹配(即是用板载显示卡、还是外接显示卡;是AGP显示卡还是PCI显示卡);
B. 对于不支持自动分配显示内存的板载显示卡,需检查BIOS中显示内存的大小是否符合应用的需要;
以下的检查应在软件最小系统下进行。
3) 检查显示器/卡的驱动:
A. 显示器/卡的驱动程序是否与显示设备匹配、版本是否恰当;
B. 显示器的驱动是否正确,如果有厂家提供的驱动程序,最好使用厂家的驱动;
C. 是否加载了合适的Direct X驱动(包括主板驱动);
D. 如果系统中装有Direct X驱动,可用其提供的Dxdiag.exe命令检查显示系统是否有故障。该程序还可用来对声卡设备进行检查。
4) 显示属性、资源的检查:
A. 在设备管理器中检查是否有其它设备与显示卡有资源冲突的情况,如有,先去除这些冲突的设备;
B. 显示属性的设置是否恰当(如:不正确的监示器类型、刷新速率、分辨率和颜色深度等,会引起重影、模糊、花屏、抖动、甚至黑屏的现象);
5) xx作系统配置与应用检查:
A. 系统中的一些配置文件(如:System.ini文件)中的设置是否恰当;
B. 显示卡的技术规格或显示驱动的功能是否支持应用的需要;
C. 是否存在其它软、硬件冲突。
6) 硬件检查:
A. 当显示调整正常后,应逐个添加其它部件,以检查是何部件引起显示不正常;
B. 通过更换不同型号的显示卡或显示器,检查是否存在它们之间的匹配问题;
C. 通过更换相应的硬件检查是否由于硬件故障引起显示不正常(建议的更换顺序为:显示卡、内存、主板)。
05 本类故障的判断流程
1.案例一
问题描述:
碰到过这样的一台机器,现象比较怪,机型为奔月2000 PIII/800,故障为经常性的开机无显,有时能显示进入系统,但使用1-2小时会出现死机,重启又无显示,只有过很长时间再开机,才可以显示。
解决方案:
碰到此问题,首先断定应为硬件问题,打开机箱,查看各板卡并无松动(注:显卡与主板插槽上的联想贴条,粘得很紧),换件试吧,先后更换过内存、CPU、电源,均不能解决问题,再换主板吧,拆撕显卡与主板插槽的联想贴条时,感觉到显卡没插到位,向下按,还能再进去一点,遂怀疑是不是显卡与主板接触不良所致,于是又把机器的原部件全都还原,试机,一切正常。
后记:
此案例就是因为显卡的接触不良,而造成的奇怪故障,在维修中因为检测时的疏漏(只查看显卡是否插紧,而未实际动手检查一下),造成了维修过程的繁琐。
2.案例二
问题描述:
一台奔月机器,用户称每次启动都无法进入WIN98,光标停留在屏幕左上角闪动,死机;但安全模式可以进入。
解决方案:
怀疑为显卡或监视器设置不当所致,进入安全模式把显示分辨率设为640*480,颜色设为16色,重启,能以正常模式进入,但只要改动一下分辨率或颜色,则机器就不能正常启动;察看机器内部,除用户自加一块网卡外,别无其它配置,难道是网卡与显卡发生了冲突?拔掉网卡,能正常启动WIN98,给网卡换个插槽,开机检测到新硬件,加载完驱动,启动,一切正常。
后记:
由于显卡与其它部件不兼容或冲突造成的死机,完全可以先采用最小系统化的方法来测试(最小系统化法即只保留主板、CPU、显卡、电源等主要部件),先排除主要的部件,再逐一检测其它扩展卡。
3.案例三
问题描述:
三角洲部队-大地勇士,在810(e)系列主板的机器上运行(同禧、逐日系列),如用随机带的显卡驱动程序安装(而用随机盘进 行驱动的安装又是我们一贯的作风),在进入游戏画面时,必然会导致死机。
解决方案:
解决方法就是从网上下载新版本的驱动,进行升级。
后记:
如果在实际维修中遇到玩3D游戏死机的故障,估计可能是显卡故障,而又无备件替换时(这在我们上门维修中,是经常遇到的),不妨从网上下载一个Direct control软件,通过它屏蔽掉AGP支持。再玩3D游戏,如不出现死机,说明问题很可能出在别处(如主板、内存)。如死机,则在很大程度上说明,这块显卡是有故障的了。
4.案例四
故障描述:
开天2200 P4/1.7G (为QDI P7LI-AL主板),在运行华光超恩组版软件时(带一ISA加密卡),如进行放大显示,则左边界线无法显示。
解决方案:
用户新购机器,代理商在为用户安装超恩组版软件时,出现问题。换一新机,故障依旧,代理判断为华光ISA卡与此机型不兼容,让维修站上门解决。
到用户处,复现故障,插一PCI显卡则显示正常,估计不为机器故障。在系统属性—性能—图形中,把硬件加速调低两格,问题解决。
05 安装类故障
01 定义举例
这类故障主要是反映在安装xx作系统或应用软件时出现的故障。
02 可能的故障现象
1、 安装xx作系统时,在进行文件复制过程中死机或报错;在进行系统配置时死机或报错;
2、 安装应用软件时报错、重启、死机等(包括复制和配置过程);
3、 硬件设备安装后系统异常(如黑屏、不启动等);
4、 应用软件卸载后安装不上,或卸载不了等。
03 可能涉及的部件
磁盘驱动器、主板、CPU、内存,及其它可能的部件、软件。
04 判断要点/顺序
1、 维修前的准备
1) 注意携带磁盘数据线;
2) 相适应的最新版设备驱动程序。
2、 环境检查
1) 软件安装
A. 检查硬件设备的连接与外观:
a) 检查与主机连接的其他设备工作是否正常;
b) 设备间的连接线是否接错或漏接。连接插头、座的接针是否有变形、缺失、短路等现象;
c) 仔细检查报错信息,判断可能造成故障的部位;
d) 观察系统是否有异味,元器件的温度;
e) CPU风扇的转速是否过慢或不稳定;
f) 驱动器工作时是否有不正常的声响。
B. 其它方面检查:
a) 认真对照软件的使用手册,确认机器的软、硬件配置符合该手册的要求;
b) 仔细观察安装介质是否完好。
2) 设备安装
A. 检查设备的连接与外观:
a) 要安装的设备、部件是否连接正确,连接电缆是否完好、接针是否有缺针、断针、或短接的现象;
b) 要安装的设备、部件的制作工艺是否优良;
c) 余类似上述软件安装。
B. 驱动程序介质检查:用于安装设备的驱动程序介质是否完好。
3、 故障判断要点
1) xx作系统安装:
A. 检查CMOS中的设置:
a) 如果需要,请先恢复到出厂设置;
b) 关闭BootEasy功能、关闭防病毒功能,及关闭BIOS防写开关;
c) 特别注意硬盘的参数、CPU的温度等。注意观察自检时显示出来的信息是否与实际的硬件配置相符。
B. 安装介质与目标介质检查:
a) 检查是否有病毒;
b) 检查分区表是否正确、分区是否激活。使用Fdisk /mbr命令来确保主引导记录是正确的(注意使用此命令后,如果机器不能启动,可证明原系统中存在病毒或有错误。硬盘应做初始化xx作);
c) 检查系统中是否有第三方内存驻留程序。
以下过程,建议在软件最小系统下检查(注:在最小系统下,需要添加与安装有关的其它驱动器)。
C. 安装过程检查:
a) 如果在复制文件时,报CAB等文件错,可偿试将原文件复制到另一介质(如硬盘)上再行安装。如果正常通过,则原安装介质有问题,可去检查介质及相应的驱动器是否有故障;若仍然不能复制,应检查相应的磁盘驱动器、数据线、内存等部件;
b) 如果是采用覆盖安装而出现上述问题,建议如果更换安装介质后仍不能排除故障,应先对硬盘进行初始化xx作,再重新安装(初始化xx作时,最好将硬盘分区彻底清除后进行)。如果仍不能解决,再考虑硬件;
c) 安装过程中,在检测硬件时出现错误提示、蓝屏或死机等,一是通过多重新启动几次(应该是关机重启),看能否通过;另一是在软件最小系统下检查是否能通过。如果不能通过,应该依次检查软件最小系统中的内存、磁盘、CPU(包括风扇)、电源等部件;如果能正常安装,则是软件最小系统之外的部件的故障或配置问题,这可通过在安装完成后,逐步添加那些部件,并判断是否有故障或配置不当;
D. 硬件及其它应注意的问题:
a) 如果安装系统时重启或掉电,要求在软件最小系统下进行测试。如果故障消失,在安装好系统以后,将软件最小系统之外的设备逐一接上,检查故障是由哪个部件引起,并用替换法解决;如果故障不能消失,应检查软件最小系统中的电源、主板和内存,甚至磁盘驱动器;
b) 在IDE设备上安装诸如UNIXxx作系统时,或要安装多个xx作系统时,要注意:一是8.4GB 限制(UNIX的开始部分必须在8.4GB之内)——这一条在SCSI设备上无这一要求;另一是多xx作系统间的安装顺序及配合关系;
E. 对于LEOS的安装应注意以下几点:
a) 确保主板BIOS支持LEOS,建议在为用户更换主板后首先就要刷新支持LEOS的BIOS;
b) 如果为用户更换硬盘,也要注意备件硬盘是否正确支持DMA66。否则在安装LEOS时也会出现问题;
c) LEOS最好是在一块全新未被分区的硬盘上进行安装。具体顺序可以参考如下方案:新硬盘-〉安装LEOS->分区(Fdisk)->安装xx作系统(Windows XP)-〉制作一键恢复。如果原硬盘存在分区,可以使用http://Clear.com程序清楚后再安装LEOS。
2) 应用软件安装:
A. 检查安装应用软件问题时应注意的问题:
a) 应用软件的安装问题,部分可参考上述的xx作系统安装的检查方法;
b) 在进行安装前,要求先备份注册表,再进行安装;
B. 软件间、软硬件间的冲突检查:
a) 可采用两种软件问题隔离的方法。一是在软件最小系统下,关闭正在运行的应用程序,然后安装需要的应用软件;另一是在原系统下直接关闭正在运行的应用程序,然后安装需要的应用软件。关闭已有的应用的方法是:使用msconfig禁用启动组、autoexec.bat、config.sys、win.ini、system.ini中在启动时调用的程序;
b) 使用任务管理器,检查系统中有无不正常的进程,并给予杀除;
c) 对于基本满足软件技术手册要求但安装不上的情况,看能否通过设置调整来解决。如果不能解决,则视为不兼容;
d) 利用其它机器(最好是不同配置的),检查是否存在软、硬件方面的兼容问题;
e) 检查系统中是否已经安装过该软件,如果已经安装过应先将其卸载后再安装,如果无法正常卸载,可以手动卸载或通过恢复注册表来卸载(对于Windows XP可使用系统还原功能来卸载);
f) 必要时,可从网络上查阅相关资料,之后再与软件厂商联系,看是否有其他的注意事项。
C. 硬件检查:
在以上的步骤都不奏效时可考虑硬件问题,应检查光驱、安装介质、硬盘线等配件。
3) 硬件设备安装:
A. 冲突检查:
a) 所安装的设备、部件是否在系统启动前的自检过程中识别到,或能由xx作系统识别到(非即插即用识备除外)。如果不能识别,应检查BIOS设置及设备本身,包括跳线及相应的插槽或端口;
b) 检查新安装的设备与原系统中的设备是否有冲突;通过改变驱动的安装顺序、去除原系统中的相应部件或设备、更换插槽,看故障是否消除。如果不能消除,则为不兼容;
c) 加装的设备是否与现有系统的技术规格或物理规格匹配;
d) 检查当前系统中的一些设置(主要是.ini文件中的设置)是否与所安装的部件或设备驱动有不匹配的地方;
B. 驱动程序检查:所安装的设备驱动是否为合适的版本(即,不一定是最新的);
C. 硬件检查:
a) 所安装的部件或设备是否本身就有故障;
b) 检查原系统中的部件是否有不良的现象(如插槽损坏、供电能力不足等)。
05 本类故障的判断流程
1.案例一
问题描述:
用户报修天禧6620机器,在安装98过程中,提示剩余三分钟时。Hwinfo报错,无法正常安装。
解决方案:
工程师上门后,经过检测,确实存在用户反应的问题。然后尝试将安装文件拷贝到硬盘上安装和换一张安装盘安装,故障依旧。接着检查BIOS发现,系统日期是2075年。将日期改回后,故障排除。问题虽小,影响却大。在此,提醒各位同仁,做事要细心,不要忽略每个细节。
2.案例二
问题描述:逐日2000机器,一次突然死机,不能启动,重装系统能成功,但在设备管理里有很多问号,如打印口,COM口等都没有驱动。
解决方案:
在站内又重装系统,驱动主板不能解决问题,看来只有更换主机才行了。打开机箱,发现有很多灰尘,取出主板,进行大扫除,抱着试一试的心里,重装一切OK。
3.案例三
问题描述:
一用户奔月4000机器/PIII 1G,他是单位技术员,说此机不能重装系统,每次重装都死机,要求上门维修。
解决方案:
到达用户处,发现重装到检测硬件时无反应,打开机器进行检查时,发现CPU风扇不是联想。客户说这是刚从市场上拿来的,新的,应没有问题。
依次替代硬盘与内存没有用,经用户同意带回站内烤机,再换下主板与CPU还是不行,后经多次重试发现每次死时间越来越短,怀疑还是CPU风扇有问题。
换其它联想机器上的风扇竟解决问题。引起故障原因是客户的CPU风扇转速不够,引起温度过高死机。
06 操作与应用类故障
01 定义举例
这类故障主要是指启动完毕后到关机前所发生的应用方面及系统方面的故障。
02 可能的故障现象
1、 休眠后无法正常唤醒;
2、 系统运行中出现蓝屏、死机、非法操作等故障现象;
3、 系统运行速度慢;
4、 运行某应用程序,导致硬件功能失效;
5、 游戏无法正常运行;
6、 应用程序不能正常使用。
03 可能涉及的部件
主板、CPU、内存、电源、磁盘、键盘、接插的板卡等
04 判断要点/顺序
1、 维修前的准备
1) 干净的可用硬盘;
2) 杀毒软件;
3) 尽可能新的驱动程序、若干版本的BIOS;
4) 磁盘连接的数据线等。
2、 环境检查
1) 市电及连接检查:
A. 检查市电是否正常,连接是否牵伤心;是否有接地;
B. 设备间的连接线是否接错或漏接。
2) 周边及外观检查:
A. 检查与主机连接的其他外设工作是否正常;
B. 驱动器工作时是否有异响,CPU风扇的转速是否过慢或不稳定;
C. 观察机箱内灰尘是否太多,而导致各插接件间接触不良。先除尘后可用橡皮等擦拭金手指,去除氧化层或灰尘。然后重新插上;
D. 观察系统是否有异味,元器件的温升是否过高或过快。
3) 显示与设置检查:
A. 详细记录报错信息,判断可能造成故障的部位;
B. 注意CMOS中对于硬盘、系统时间、CPU温度的设置,注意在自检时显示的硬件信息和机器配置是否相符;
C. 仔细阅读软件的使用指南,注意软件运行的环境要求。
4) 充分与用户沟通:
A. 了解用户的使用情况;
B. 出故障前的现象;
C. 做过什么操作才出现目前的故障。
根据以上了解的情况,来初步判断可能的故障原因。
3、 故障判断要点
1) 检查是否由于用户误操作引起
A. 机器出现死机、蓝屏或无故重启时,首先要考虑到用户的操作是否符合操作规范和要求,要仔细询问、观察用户的操作方法是否符合常理,并由工程师用正确的方法操作、应用用户的机器,查看是否出现用户所报修的故障。若不出现,则可认为是用户操作不当引起的,由工程师向用户解释并演示正确的操作方法。
B. 若经过上述操作故障依然存在,可用系统文件检查器检查用户的机器系统是否有丢失的DLL文件,并尝试恢复。
C. 注意观察用户的机器在死机、蓝屏或无故重启时有没有规律,并找出可能引起机器故障的原因(如机器在运行某一程序时或机器开机在一定时间内死机)。
D. 通过与另一台软硬件相同且无故障的机器进行比较,查看故障机的文件大小是否相同或相差不大,主程序的版本是否一致。
2) 检查是否由于病毒或防病毒程序引起故障
A. 检查用户的机器是否被病毒感染,使用杀毒软件杀毒;
B. 检查用户是否安装了两个或两个以上的防毒软件,建议用户使用其中一个,并卸载其他的防毒软件;
C. 检查是否有木马程序,用最新版的杀毒程序可以查出木马程序。可以通过安装补丁来弥补程序中的安全漏洞,或者安装防火墙。
3) 检查是否由于操作系统问题引起故障
A. 检查硬盘是否有足够的剩余空间,并检查临时文件是否太多。整理硬盘空间,删除不需要的文件;
B. 对于系统文件损坏或丢失,可以使用系统文件检查器进行检查和修复;
C. 检查操作系统是否安装了合适的系统补丁(对于Winnt可在启动时观察service pack的版本,推荐使用SP6;Win2k和Winxp可以在系统属性中查看,Win2k推荐使用SP3,Winxp推荐使用SP1。);
D. 检查DirectX驱动是否正常,升级DirectX的版本;
E. 检查是否正确安装了设备的驱动程序,并且驱动的版本是否合适。检查驱动安装的顺序是否正确(例如:首先安装主板驱动)。
4) 检查是否由软件冲突、兼容引起故障
A. 检查用户应用软件的运行环境是否与现有的操作系统(NT/98/2K/XP)相兼容,可通过查看软件说明书或到应用软件网页上查找相关资料,并查看网页上有没有对于此软件的升级程序或补丁可安装。
B. 可用任务管理器观察故障机器的后台是否有不正常的程序在运行,并尝试关闭程序只保留最基本的后台程序。
C. 注意查看故障机内是否有共用的DLL文件,可通过改变安装顺序或安装目录来解决问题。
5) 检查硬件设置是否不正确
A. 首先,检查CMOS设置是否正确,可恢复默认值;
B. 在设备管理器中检查硬件是否正常,中断是否有冲突,如有冲突,调整系统资源(对于某些硬件,要阅读说明书,按照说明正确设置硬件);
C. 在设备管理器中将硬件驱动删除,重新安装驱动程序(最好安装版本正确的驱动程序),查看硬件驱动是否恢复正常;
D. 运行硬件检测程序,如AMI等检测硬件是否有故障;
E. 在软件最小系统情况下, 重新更新硬件驱动,观察故障是否消失。
6) 检查是否为兼容问题
A. 遇到兼容性问题时,应检查硬件的规格和标准(如同时使用多条内存时检查内存是否为同一厂家、同一规格、同一容量、内存颗粒同一批次),是否允许在一起使用。
B. 阅读说明书或到网页上查找相关资料,检查用户的硬件正常使用所需的软件要求,现在的软件环境是否符合要求,软硬件之间是否相互支持。
C. 在设备管理器中检查用户的系统资源是否有冲突,如有冲突,手动调整系统源。
D. 在设备管理器中检查用户机器的硬件的驱动是否安装正确,更新合适版本的设备驱动(如某些显卡用WIN2000或WINXP自带的公版驱动,会造成某些大型3D游戏无法运行);
E. 检查维修BOM,去除非联想的硬件,检查系统是否可正常工作,如可正常工作,建议用户更换自行添加的硬件或查找硬件相关资料进行解决。
7) 检查是否由于网络故障引起
A. 碰到机器连接在网络上,出现死机、运行慢、蓝屏等故障时,应首先关闭网络,与网络环境隔离,观察故障是否消失,如故障消失,则为网络问题引起故障。
B. 确为网络问题引起的故障,其判断与解决步骤参考网络部分。
8) 检查是否由于硬件性能不佳或损坏引起
A. 使用相应的硬件检测程序,检查硬件是否有故障,如果有,利用替换法排除相应的硬件;
B. 用替换法检查检测程序无法判断的硬件故障。
整理:老杨丨10年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部