运行GPT-3模型时，出现Megatron requires CUDA的报错提示-昇腾社区

运行GPT-3模型时，出现Megatron requires CUDA的报错提示

2025/01/26

暂无评分

我要评分

问题信息

问题来源	产品大类	产品子类	关键字
官方	集群调度	断点续训	GPT-3、megatron_npu包

运行GPT-3模型（PyTorch）时，出现Megatron requires CUDA的报错提示。

CUDA是GPU的驱动，在NPU环境上跑GPT-3模型，出现Megatron requires CUDA的错误提示，有以下原因：

当前训练环境没有安装megatron_npu（megaton框架对NPU设备的适配包）。
有安装megatron_npu，但是PyTorch的dist-packages下面没有megatron_npu包，训练程序运行时找不到megatron_npu包的路径。

可执行pip list | grep -i megatron_npu命令，查看当前环境是否有安装megatron_npu包。

本页内容