概述
简述
PSPNet,利用FCN中嵌入了不同场景的上下文特征。相比于FCN,语义分割性能由显著的提升。本文档描述的是PSPNet在Pytorch框架下实现的版本。
参考实现:
url=https://github.com/open-mmlab/mmsegmentation.git commit_id=9f071cade8cdc59c13b416c7c9843005410c055c
适配昇腾 AI 处理器的实现:
url=https://gitee.com/ascend/ModelZoo-PyTorch.git code_path=PyTorch/contrib/cv/semantic_segmentation
通过Git获取代码方法如下:
git clone {url} # 克隆仓库的代码 cd {code_path} # 切换到模型代码所在路径,若仓库下只有该模型,则无需切换
通过单击“立即下载”,下载源码包。
准备训练环境
准备环境
当前模型支持的固件与驱动、 CANN 以及 PyTorch 如下表所示。
表 1 版本配套表
配套 版本 固件与驱动 5.1.RC2 CANN 5.1.RC2 PyTorch 1.8.1 环境准备指导。
请参考《Pytorch框架训练环境准备》。
安装依赖。
pip install -r requirements.txt
构建mmcv 。
下载mmcv=1.2.7到
$YOURMODELZOO
(用户自定义目录) ,进入到源码包 根目录下,将mmcv_replace/
目录下的文件替换到$YOURMMVCPATH/mmcv
安装目录下。cd /${模型文件夹名称} # configure source env_npu.sh # copy rm -rf $YOURMMVCPATH/mmcv mkdir $YOURMMVCPATH/mmcv cp -r $PSPNET/mmcv_replace/* $YOURMMVCPATH/mmcv/ # compile cd $YOURMMVCPATH export MMCV_WITH_OPS=1 export MAX_JOBS=8 python3 setup.py build_ext python3 setup.py develop pip3.7.5 list | grep mmcv cd /${模型文件夹名称}
权限配置。
chmod -R 777 ./
删除
mmcv_replace
文件夹。rm -rf mmcv_replace
准备数据集
- 获取数据集。
下载PASCAL VOC 2012 数据集和PASCAL VOC2010 数据集的训练和验证集。
解压后的数据集结构为:
├── VOCdevkit │ │ ├── VOC2012 │ │ ├── VOC2010
在数据集目录下新建
VOCaug/
目录,下载PASCALAug 数据集。
解压后,复制benchmark_REALSE/dataset
到文件夹VOCaug
中。├── VOCdevkit │ │ ├── VOC2012 │ │ ├── VOC2010 │ │ ├── VOCaug
- 数据预处理。
使用以下命令转换 VOCAug 数据集。
cd /${模型文件夹名称} python tools/convert_datasets/voc_aug.py data/VOCdevkit data/VOCdevkit/VOCaug --nproc 8
[可选] 将数据集软链接到 mmseg100 的文件夹。
cd /${模型文件夹名称} mkdir data ln -s VOCdevkit data # data_path=./data/VOCdevkit/VOC2012
开始训练
训练模型
进入解压后的源码包根目录。
cd /${模型文件夹名称}
运行训练脚本。
该模型支持单机单卡训练和单机8卡训练。
单机单卡训练
启动单卡训练。
``` # training 1p accuracy bash ./test/train_full_1p.sh --data_path=xxx # --data_path=data/VOCdevkit/VOC2012 ```
单机8卡训练
启动8卡训练。
``` # training 8p accuracy bash ./test/train_full_8p.sh --data_path=xxx # --data_path=data/VOCdevkit/VOC2012 ```
多机多卡性能数据获取流程
1. 安装环境 2. 开始训练,每个机器所请按下面提示进行配置 bash ./test/train_performance_multinodes.sh --data_path=数据集路径 --batch_size=单卡batch_size --nnodes=机器总数量 --node_rank=当前机器rank(0,1,2..) --local_addr=当前机器IP(需要和master_addr处于同一网段) --master_addr=主节点IP
--data_path参数填写数据集路径。
模型训练脚本参数说明如下。
公共参数:
--device //指定gpu或npu
--data_path //数据集路径
--addr //主机地址
--amp //是否使用混合精度
--loss-scale //混合精度lossscale大小
--opt-level //混合精度类型
多卡训练参数:
--device-list '0,1,2,3,4,5,6,7' //多卡训练指定训练用卡
日志和检查点路径:
./output/devie_id/PSPNet/train_${device_id}.log # training detail log
./output/devie_id/PSPNet/PSPNet_bs16_8p_acc.log # 8p training performance result log
./output/devie_id/PSPNet/ckpt # checkpoits
./output/devie_id/PSPNet_prof/PSPNet_bs16_8p_acc.log # 8p training accuracy result log
训练结果展示
表 2 训练结果展示表
device | fps | aAcc | mIoU | mAcc |
---|---|---|---|---|
8p-竞品 | 82.296 | 94.92 | 77.13 | 85.7 |
8p-1.5 | 117.808 | 94.71 | 77.04 | 86.52 |
8p-1.8 | 119.84 | 94.23 | 75.22 | 85.07 |
版本说明
变更
2020.10.14:更新内容,重新发布。
2020.07.08:首次发布。
已知问题
无。
公网地址说明
代码涉及公网地址参考 public_address_statement.md