下载
中文
注册

在模型调测时遇到报错“RuntimeError: malloc:/..../pytorch/c10/npu/NPUCachingAllocator.cpp:293 NPU error, error code is 500000.”

问题描述

  • 报错截图

  • 报错文本
    Error: test_conv2d_npu (__main__.TestConv2dNPU)
    Traceback (most recent call last):
    ……
    RuntimeError: malloc:/***/pytorch/c10/npu/NPUCachingAllocator.cpp:293 NPU error, error code is 500000

问题分析

NPUCachingAllocator中malloc类型的错误原因一般为NPU显存不足,所需显存大于NPU上可用显存。

处理方法

在模型调测中,可减小batch size参数来减少NPU显存的分配。