PSPNet-PyTorch

概述

简述

PSPNet，利用FCN中嵌入了不同场景的上下文特征。相比于FCN，语义分割性能由显著的提升。本文档描述的是PSPNet在Pytorch框架下实现的版本。

参考实现：

url=https://github.com/open-mmlab/mmsegmentation.git
commit_id=9f071cade8cdc59c13b416c7c9843005410c055c

适配昇腾 AI 处理器的实现：

url=https://gitee.com/ascend/ModelZoo-PyTorch.git
code_path=PyTorch/contrib/cv/semantic_segmentation

通过Git获取代码方法如下：

git clone {url}    # 克隆仓库的代码
cd  {code_path}    # 切换到模型代码所在路径，若仓库下只有该模型，则无需切换

通过单击“立即下载”，下载源码包。

准备训练环境

准备环境

当前模型支持的固件与驱动、 CANN 以及 PyTorch 如下表所示。

表 1 版本配套表

配套版本

固件与驱动 5.1.RC2

CANN 5.1.RC2

PyTorch 1.8.1
环境准备指导。

请参考《Pytorch框架训练环境准备》。
安装依赖。
```
pip install -r requirements.txt
```

配套	版本
固件与驱动	5.1.RC2
CANN	5.1.RC2
PyTorch	1.8.1

构建mmcv 。

下载mmcv=1.2.7到$YOURMODELZOO(用户自定义目录) ，进入到源码包根目录下，将mmcv_replace/目录下的文件替换到 $YOURMMVCPATH/mmcv安装目录下。

cd /${模型文件夹名称}

# configure
source env_npu.sh

# copy
rm -rf $YOURMMVCPATH/mmcv
mkdir $YOURMMVCPATH/mmcv
cp -r $PSPNET/mmcv_replace/* $YOURMMVCPATH/mmcv/

# compile
cd $YOURMMVCPATH
export MMCV_WITH_OPS=1
export MAX_JOBS=8
python3 setup.py build_ext
python3 setup.py develop
pip3.7.5 list | grep mmcv

cd /${模型文件夹名称}

权限配置。
```
chmod -R 777 ./
```
删除mmcv_replace文件夹。
```
rm -rf mmcv_replace
```

准备数据集

获取数据集。

下载PASCAL VOC 2012 数据集和PASCAL VOC2010 数据集的训练和验证集。

解压后的数据集结构为：
```
├── VOCdevkit
│   │   ├── VOC2012
│   │   ├── VOC2010
```
在数据集目录下新建VOCaug/目录，下载PASCALAug 数据集。
解压后，复制benchmark_REALSE/dataset到文件夹VOCaug中。
```
├── VOCdevkit
│   │   ├── VOC2012
│   │   ├── VOC2010
│   │   ├── VOCaug
```

数据预处理。

使用以下命令转换 VOCAug 数据集。

cd /${模型文件夹名称}
python tools/convert_datasets/voc_aug.py data/VOCdevkit data/VOCdevkit/VOCaug --nproc 8

[可选] 将数据集软链接到 mmseg100 的文件夹。

cd /${模型文件夹名称}
mkdir data
ln -s VOCdevkit data # data_path=./data/VOCdevkit/VOC2012

开始训练

训练模型

进入解压后的源码包根目录。
```
   cd /${模型文件夹名称}
```

运行训练脚本。

该模型支持单机单卡训练和单机8卡训练。

单机单卡训练

启动单卡训练。

```
# training 1p accuracy
bash ./test/train_full_1p.sh --data_path=xxx
# --data_path=data/VOCdevkit/VOC2012 
```

单机8卡训练

启动8卡训练。

```
# training 8p accuracy
bash ./test/train_full_8p.sh --data_path=xxx
# --data_path=data/VOCdevkit/VOC2012 
```

多机多卡性能数据获取流程

    1. 安装环境
    2. 开始训练，每个机器所请按下面提示进行配置
        bash ./test/train_performance_multinodes.sh  --data_path=数据集路径 --batch_size=单卡batch_size --nnodes=机器总数量 --node_rank=当前机器rank(0,1,2..) --local_addr=当前机器IP(需要和master_addr处于同一网段) --master_addr=主节点IP

--data_path参数填写数据集路径。

模型训练脚本参数说明如下。

公共参数：
--device                            //指定gpu或npu
--data_path                         //数据集路径
--addr                              //主机地址     
--amp                               //是否使用混合精度
--loss-scale                        //混合精度lossscale大小
--opt-level                         //混合精度类型
多卡训练参数：
--device-list '0,1,2,3,4,5,6,7'     //多卡训练指定训练用卡

日志和检查点路径：

./output/devie_id/PSPNet/train_${device_id}.log             # training detail log
./output/devie_id/PSPNet/PSPNet_bs16_8p_acc.log             # 8p training performance result log
./output/devie_id/PSPNet/ckpt                               # checkpoits
./output/devie_id/PSPNet_prof/PSPNet_bs16_8p_acc.log        # 8p training accuracy result log

训练结果展示

表 2 训练结果展示表

device	fps	aAcc	mIoU	mAcc
8p-竞品	82.296	94.92	77.13	85.7
8p-1.5	117.808	94.71	77.04	86.52
8p-1.8	119.84	94.23	75.22	85.07

版本说明

变更

2020.10.14：更新内容，重新发布。

2020.07.08：首次发布。

已知问题

无。

公网地址说明

代码涉及公网地址参考 public_address_statement.md

使用模型资源和服务前，请您仔细阅读并理解透彻《昇腾深度学习模型许可协议 3.0》

PSPNet-PyTorch

概述

简述

准备训练环境

准备环境

准备数据集

开始训练

训练模型

训练结果展示

版本说明

变更

已知问题

公网地址说明

关于昇腾

新闻与活动

交流与资讯

支持与服务

开源社区

Links