BMC冷复位后未记录sel事件问题分析
更新时间: 2026/05/28
在Gitcode上查看源码

问题背景

  • 单板类型:NA;
  • 软件版本:bmc_soc组件1.80.25版本;
  • 涉及功能:BMC冷复位,事件&告警;
  • 触发条件:BMC冷复位命令 15分钟下发一次冷复位命令。
  • 业务表现:BMC冷复位命令 15分钟下发一次冷复位命令 ipmitool mc reset cold,预期BMC每次冷复位都有sel日志记录;实际偶现其中一次未记录sel日志。

问题复现步骤

  1. BMC冷复位命令 15分钟下发一次冷复位命令 ipmitool mc reset cold,偶现其中一次未记录sel日志。

关键日志信息

查看日志,确认报错如下:

定位过程

  1. 根据串口日志,可以看出17:20发生的这次重启没有sel日志
  2. 分析app.log,bmc_soc组件报错"add RESSET enable events failed."
  3. 查看RTOSDump/versioninfo/package_info bmc_soc版本号

问题原因

bmc_soc组件中初始化时event对象失败,后续没有成功获取。

解决方案

bmc_soc组件1.80.27版本解决此问题:

  • 修改逻辑:

    初始化时event对象失败时添加重试。