BMC重启后BBU告警先消除后产生问题分析
更新时间: 2026/06/02
在Gitcode上查看源码问题背景
- 单板类型:920c;
- 软件版本:openUBMC 25.3.0.B001;
- 涉及功能:BMC重启,告警;
- 触发条件:有bbu告警时,重启BMC;
- 业务表现:预期bbu告警依然存在且不会出现先消除在产生的情况,实际上查看告警日志显示告警先消除再生成。
问题复现步骤
- 环境上默认存在一个BBU告警,告警码为0x0800003B;
- 重启BMC;
- 启动成功后查看告警日志;
关键日志信息
sel.txt文件如下:
定位过程
目前看,当前告警0x0800003B在重启过程中存在先恢复,后产生的情况;排查BMC复位时该告警是否需要恢复,若需要恢复则按照当前的流程处理为正常情况,若不需要恢复,则需要检查复位场景下告警关联属性是否会被置成恢复告警的值。
问题原因
该告警不应再BMC复位时出现先恢复再产生的情况;按照社区告警配置手册CSR配置字典之Event类中存在属性InvalidReadingIgnore和InvalidReading的功能描述,需要再对应的告警中进行配置,但是vpd组件中相关的代码中没有相关配置,导致复位过程中出现消除再产生的情况。
解决方案
复位场景,告警属性InvalidReading设置为255,InvalidReadingIgnore配置为1,当InvalidReadingIgnore为1时读值如果等于InvalidReading的值255则忽略。修改代码后,出包升级,重启BMC,查看告警事件,确认是否依然存在先消除再产生的情况即可;