BMC重启后BBU告警先消除后产生问题分析
更新时间: 2026/06/02
在Gitcode上查看源码

问题背景

  • 单板类型:920c;
  • 软件版本:openUBMC 25.3.0.B001;
  • 涉及功能:BMC重启,告警;
  • 触发条件:有bbu告警时,重启BMC;
  • 业务表现:预期bbu告警依然存在且不会出现先消除在产生的情况,实际上查看告警日志显示告警先消除再生成。

问题复现步骤

  1. 环境上默认存在一个BBU告警,告警码为0x0800003B;
  2. 重启BMC;
  3. 启动成功后查看告警日志;

关键日志信息

sel.txt文件如下:

定位过程

目前看,当前告警0x0800003B在重启过程中存在先恢复,后产生的情况;排查BMC复位时该告警是否需要恢复,若需要恢复则按照当前的流程处理为正常情况,若不需要恢复,则需要检查复位场景下告警关联属性是否会被置成恢复告警的值。

问题原因

该告警不应再BMC复位时出现先恢复再产生的情况;按照社区告警配置手册CSR配置字典之Event类中存在属性InvalidReadingIgnore和InvalidReading的功能描述,需要再对应的告警中进行配置,但是vpd组件中相关的代码中没有相关配置,导致复位过程中出现消除再产生的情况。

解决方案

复位场景,告警属性InvalidReading设置为255,InvalidReadingIgnore配置为1,当InvalidReadingIgnore为1时读值如果等于InvalidReading的值255则忽略。修改代码后,出包升级,重启BMC,查看告警事件,确认是否依然存在先消除再产生的情况即可;

PR链接

gitcodegitcode