产生线缆接线告警问题分析
更新时间: 2026/06/02
在Gitcode上查看源码

问题背景

  • 单板类型:自研板;
  • 软件版本:openUBMC 25.12;
  • 涉及功能:线缆,告警;
  • 触发条件:接上SEC和BCU之间的线缆后,重启或者AC后登录BMC查看告警信息。
  • 业务表现:预期无告警;实际产生0x28000031告警码的告警信息。

问题来源

社区论坛

问题复现步骤

接上线缆后,重启或者AC后登录BMC查看告警信息,产生0x28000031告警码的告警信息。

关键日志信息

AppDump/event/current_event.txt文件存在如下报错: app日志截图:

定位过程

  1. 根据current_event.txt文件中的UID在AppDump/pcie_device/cable_info查看该UID对应的接线;
  2. 如果是这种uid没有值的日志,去app.log里面查找(也可能在app.log.1.gz等历史日志里面),搜索关键词:
text
  [BizTopoMonitor] Port: name=

3. 对比线缆适配文件; 找到线缆适配PSR文件,文件路径是:AppDump/hwdiscovery/Connector_PSR_EEP_0101.bin。重命名PSR文件为.rar后缀的文件并解压(如果本身就是.sr格式结束的文件明,则不需要解压),将文件重命名为.json格式的文件:

使用vscode打开,并格式化文件内容,展示成json格式,搜索告警的UID,与cable_info对比: app.log与json文件比对结果: 从比对结果可知,这个接线A1a和A1c刚好接反了。

问题原因

硬件问题,A1a和A1c两个地方接反了。

解决方案

A1a和A1c两个地方接反了,A1a和A1c调转接线即可;验证方式是将A1a和A1c接线口调转后,重启BMC或者AC后查看告警码0x28000031对应的告警是否依然存在即可。