出现以下报错:
1 2 3 4 | [ 33%] Building CCE object cmake/npu/CMakeFiles/reduce_sum_custom_npu.dir///reduce_sum_custom.cpp.o error: stack frame size (16024) exceeds limit (16000) in function '_ZN7AscendC9ReduceSumIDhEEvRKNS_11LocalTensorIT_EES5_S5_i' error: stack frame size (16024) exceeds limit (16000) in function '_ZN7AscendC9ReduceSumIDhEEvRKNS_11LocalTensorIT_EES5_S5_i' 2 errors generated. |
出现该错误代表核函数使用的栈空间过大,超过了硬件限制,可通过以下两种方法进行解决:
使用ccec -v命令可查询编译器版本,建议使用2024-07及之后的编译器版本。