服务器报错:“Unhealthy status reported by this UEFI driver without specific error message”.. 记录解决过程

avatar
作者
猴君
阅读量:0

我是dell R740xd设备
服务器报错如下:
在这里插入图片描述

1. 确认问题:

① 根据提示,按任意键。
界面如下:
在这里插入图片描述② 回车确认,如下图
在这里插入图片描述③ 输入 ok,点finish
④ 再次进入。
正常是可以到阵列卡界面的。如下图
在这里插入图片描述
⑤ 挨个查看物理磁盘、虚拟磁盘状态如下

在这里插入图片描述阵列failed

在这里插入图片描述两个硬盘foreign状态。(foreign状态表示硬盘中的配置与当前控制器配置不匹配)
确认问题:两块硬盘状态异常,为foreign状态,导致阵列异常!

2. 解决方法:

以下步骤由dell提供,已操作没问题,部分没拍照

①清理高速缓存
F2进bios后界面,Device setting > Controller Managemen t > Advanced Controller Properties >Cache and Memory > Discard Preserved Cache(不一定是灰色)

② 导入foreign
F2进入BIOS → Device settings → …PERC卡… → Main Menu > Configuration Management → Manage Foreign Configuration > → Preview Foreign Configuration → Import Foreign Configuration
到如下界面,
勾选confirm,yes
在这里插入图片描述确认后退出,
如进入以下界面,等待,
在这里插入图片描述
按F2,再看看物理磁盘及虚拟磁盘的状态
在这里插入图片描述raid状态已经从 failed 变成 degraded
说明:Virtual Disks(虚拟磁盘)状态显示为Degraded意味着RAID阵列中的一个或多个物理磁盘发生了故障或失效,但阵列仍然在工作.加Degraded状态提示用户阵列的容错能力已经降低,存在数据丢失的风险
在这里插入图片描述硬盘状态从 foreign变成 online。

再次试试能不能进入系统。
我的进去了,数据也没有丢失

3. 原因分析:

硬盘在未被人为移除或搬动的情况下出现FOREIGN状态,通常是由于以下几个原因造成的:

1. 硬盘故障

硬盘本身可能出现了物理故障或逻辑故障,这会导致其在RAID控制器上被标记为FOREIGN。

2. RAID控制器故障

RAID控制器可能出现了故障,导致其无法正确识别硬盘,或者在硬盘和RAID配置之间出现不一致。

3. 硬盘与RAID控制器的通信问题

电缆、连接器或背板问题可能导致硬盘与RAID控制器之间的通信不稳定或中断,进而导致硬盘被标记为FOREIGN。

4. 电源问题

电源故障或不稳定的电源供应也可能导致硬盘在运行时出现问题,导致其被RAID控制器标记为FOREIGN。

5. RAID配置数据损坏

RAID配置数据可能因为突然断电或其他不可预见的原因导致损坏,使RAID控制器无法识别硬盘的原始配置。

6. 磁盘固件问题

硬盘固件的问题可能导致其在RAID控制器上被误识别为FOREIGN。

4. 处理思路步骤:

1. 检查硬盘和控制器状态

进入RAID控制器BIOS(通常是开机时按F2进setting):
① 检查各硬盘状态。
② 检查RAID配置。

2. 处理FOREIGN状态硬盘

如上图示步骤

3. 更新固件

确保RAID控制器和硬盘的固件是最新版本,固件更新可以解决已知问题并提高稳定性。

4. 重建RAID阵列

如果清除FOREIGN状态后,RAID阵列仍然不可用,可能需要重建阵列:

重建RAID阵列:
1. 选择需要包含在阵列中的硬盘。
2. 按照控制器的指示,重建RAID 5阵列。

很不幸!我的服务器过了几个小时,硬盘又异常掉线了…
故障现象:某个硬盘重建阵列时,很慢,且有两次,重建到10%多,就掉线

怀疑背板、阵列卡、sas线故障

目前已操作:

  1. 更新硬盘、阵列卡固件
  2. 服务器放静电
  3. 更换硬盘位置,还有空槽位

注:每次掉线后,都需先清理高速缓存,处理foreign状态。

记录:更换硬盘槽位后,阵列重建(很慢,将近6 7个小时),恢复正常了
在这里插入图片描述

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!