产生线缆接线告警问题分析
更新时间: 2026/06/02
在Gitcode上查看源码问题背景
- 单板类型:自研板;
- 软件版本:openUBMC 25.12;
- 涉及功能:线缆,告警;
- 触发条件:接上SEC和BCU之间的线缆后,重启或者AC后登录BMC查看告警信息。
- 业务表现:预期无告警;实际产生0x28000031告警码的告警信息。
问题来源
问题复现步骤
接上线缆后,重启或者AC后登录BMC查看告警信息,产生0x28000031告警码的告警信息。
关键日志信息
AppDump/event/current_event.txt文件存在如下报错: app日志截图:
定位过程
- 根据current_event.txt文件中的UID在AppDump/pcie_device/cable_info查看该UID对应的接线;
- 如果是这种uid没有值的日志,去app.log里面查找(也可能在app.log.1.gz等历史日志里面),搜索关键词:
text
[BizTopoMonitor] Port: name=3. 对比线缆适配文件; 找到线缆适配PSR文件,文件路径是:AppDump/hwdiscovery/Connector_PSR_EEP_0101.bin。重命名PSR文件为.rar后缀的文件并解压(如果本身就是.sr格式结束的文件明,则不需要解压),将文件重命名为.json格式的文件:
使用vscode打开,并格式化文件内容,展示成json格式,搜索告警的UID,与cable_info对比: app.log与json文件比对结果: 从比对结果可知,这个接线A1a和A1c刚好接反了。
问题原因
硬件问题,A1a和A1c两个地方接反了。
解决方案
A1a和A1c两个地方接反了,A1a和A1c调转接线即可;验证方式是将A1a和A1c接线口调转后,重启BMC或者AC后查看告警码0x28000031对应的告警是否依然存在即可。