docker启动ms的faster RCNN demo 训练报错Insufficient shared memory available
2024/02/22
228
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 模型训练 | MindSpore | docker启动ms |
问题现象描述
docker启动ms的faster RCNN demo 训练报错Insufficient shared memory available
原因分析
batch_size设置过大;
set_prefetch_size()接口参数设置过大;
host 侧shared内存不足;
排查方法
1.将batch_size改小,看是否能跑通。
2.将set_prefetch_size()接口入参设置小一点。
3.进入docker,运行df –h查看shared内存是否够用。
解决措施
使用docker run命令创建容器时添加—ipc=host参数(表示容器间都共享宿主机的内存),或者添加—shm-size参数指定内存大小(如--shm-size 800g)。
本页内容