nvme盘故障后硬盘背板亮红灯问题分析
更新时间: 2026/05/28
在Gitcode上查看源码

问题背景

  • 单板类型:NA;
  • 软件版本:NA;
  • 涉及功能:故障告警;
  • 触发条件:nvme盘故障后硬盘背板亮红灯,拔出硬盘后硬盘背板红灯会继续亮着。
  • 业务表现:预期拔盘后故障灯灭;实际盘出现故障告警,查看对应的盘位亮红灯,拔出盘后,硬盘背板依然亮红灯。

问题复现步骤

做GEN5的24 NVMe硬盘背板的测试时,盘出现故障告警,查看对应的盘位亮红灯,拔出盘后,硬盘背板依然亮红灯。

关键日志信息

日志报错:

定位过程

查看storage的代码,发现src/lualib/drive/drive_object.lua里面,NVMe盘拔出后,是停掉了 update_dynamic_info的任务,但点故障灯的操作没有进行灭掉的操作。

问题原因

故障告警通过self.Failure = false的方式来消除拔盘后的告警;故障灯不会被单独点灭。

解决方案

在停止任务的时候设置默认值 self.Failure = false。