930版本Atlas 300I A2卡调速失败问题分析
更新时间: 2026/05/28
在Gitcode上查看源码

问题背景

  • 单板类型:NA
  • 软件版本:930版本。
  • 涉及功能:风扇调速。
  • 触发条件:csr文件没有配置CoolingArea。
  • 业务表现:预期风扇正常调速;实际使用930版本基线调试Atlas 300I A2卡,发现无法进行自动调速。

问题复现步骤

  1. 设置NPU2 AICORE Temp为90摄氏度,超过TargetTemperatureCelsius的85度。

  1. 查看NPU2 AICORE Temp传感器读值。
  2. 查看风扇转速。
  3. 确认调速模式设置的是节能模式。

关键日志信息

传感器NPU2 AICORE Temp的读值大于阈值:

风扇转速占空比一直是20%,并没有拉高转速:

通过lsobj CoolingArea未查询到对应的CoolingArea:

定位过程

  1. 排查机器是否正常上电,且OS驱动是否正常识别卡。
  2. 调速策略未生效,需确认配置是否正确:
    • 可通过查看关键日志send target temp是否存在对应调速策略下发
    • mdbctl lsobj 对应的CoolingRequirement对象下查看私有属性IsValid是否生效。
  3. 检查CoolingRequirement与CoolingArea是否对应,通过lsobj CoolingArea未查询到对应的CoolingArea,发现社区代码提供的csr文件没有配置CoolingArea。

问题原因

社区代码提供的csr文件没有配置CoolingArea。

解决方案

csr文件中添加CoolingArea配置,添加后可以正常调速。