AC循环概率出现CPU、内存温度拿不到的情况问题分析
更新时间: 2026/05/28
在Gitcode上查看源码

问题背景

  • 单板类型:NA;
  • 软件版本:openUBMC 25.06;
  • 涉及功能:告警&事件;
  • 触发条件:ipmb 消息通道对应的服务异常。
  • 业务表现:预期AC循环测试,不出现异常;实际AC循环概率出现CPU、内存温度拿不到的告警。

问题复现步骤

  1. 执行AC循环测试。
  2. 登录web页面->维护诊断->告警&事件,出现CPU、内存温度拿不到的告警。

关键日志信息

  1. 详细告警信息为:

定位过程

  1. 查询传感器页面也没有CPU相关的电压信息
  2. 怀疑和ipmb通道有关,使用调试命令跟踪ipmb通道信息:
  3. 收集一段时间,在/tmp/目录没有发现ipmi.txt文件,app.log 日志中持续出现异常打印。

问题原因

从收集的日志中可以分析出 ipmb 消息通道对应的服务异常了,无法发送和接收 ipmb 消息,所以无法获取到 CPU 和 内存的温度。

解决方案

BIOS启动快于BMC准备就绪,提前丝印获取时间,减少超时导致的内存等加载不上问题。

PR链接

优化丝印获取时间