FCN8s-PyTorch

概述

简述

FCN8s是一个经典的语义分割网络，FCN8s使用全卷积结构，可以接受任意尺寸的输入图像，采用反卷积对最后一层的特征图进行上采样，得到与输入图像相同尺寸的输出，从而对输入进行逐像素预测。

参考实现：

url=https://github.com/open-mmlab/mmsegmentation.git
commit_id=9f071cade8cdc59c13b416c7c9843005410c055c

适配昇腾 AI 处理器的实现：

url=https://gitee.com/ascend/ModelZoo-PyTorch.git
code_path=PyTorch/contrib/cv/semantic_segmentation

通过Git获取代码方法如下：

git clone {url}        # 克隆仓库的代码
cd {code_path}         # 切换到模型代码所在路径，若仓库下只有该模型，则无需切换

通过单击“立即下载”，下载源码包。

准备训练环境

准备环境

当前模型支持的固件与驱动、 CANN 以及 PyTorch 如下表所示。

表 1 版本配套表

配套版本

固件与驱动 5.1.RC2

CANN 5.1.RC2

PyTorch 1.8.1
环境准备指导。

请参考《Pytorch框架训练环境准备》。
安装依赖。
```
pip install -r requirements.txt
```

配套	版本
固件与驱动	5.1.RC2
CANN	5.1.RC2
PyTorch	1.8.1

构建mmcv。

下载mmcv1.2.7到路径$YOURMMVCPATH。然后，复制mmcv_replace 到 $YOURMMVCPATH/mmcv。

# configure
cd /${模型文件夹名称}
source env_npu.sh

# copy
rm -rf $YOURMMVCPATH/mmcv
mkdir mmcv
cp -r mmcv_replace/* $YOURMMVCPATH/mmcv/

# compile
cd $YOURMMVCPATH
export MMCV_WITH_OPS=1
export MAX_JOBS=8
python3 setup.py build_ext
python3 setup.py develop
pip3.7.5 list | grep mmcv

cd /${模型文件夹名称}

权限配置。
```
chmod -R 777 ./
```
删除 mmcv_replace 文件夹。
```
rm -rf mmcv_replace
```

准备数据集

获取数据集。

下载 PASCAL VOC 2012 数据集和 PASCAL VOC2010 数据集的训练集和验证集。

解压后，数据集目录结构如下所示：
```
├── VOCdevkit
│   │   ├── VOC2012
│   │   ├── VOC2010
```
下载 PASCALAug数据集。

解压后，复制benchmark_REALSE/dataset到VOCdevkit文件夹下的VOCaug。

数据集目录结构如下所示：
```
├── VOCdevkit
│   │   ├── VOC2012
│   │   ├── VOC2010
│   │   ├── VOCaug
```

数据预处理。

使用以下命令转换 VOCAug 数据集。
```
cd /${模型文件夹名称}
python tools/convert_datasets/voc_aug.py data/VOCdevkit data/VOCdevkit/VOCaug --nproc 8
```
说明: 可能会提示Segmentation fault (core dumped) ，提示原因是mmcv需要pytorch支持。请返回源码包根目录并运行 source env_npu.sh。

[可选] 建立数据集到文件夹mmseg100的软链。

cd /${模型文件夹名称}
mkdir data
ln -s VOCdevkit data # data_path=./data/VOCdevkit/VOC2012

开始训练

训练模型

进入解压后的源码包根目录。
```
cd /${模型文件夹名称} 
```

运行训练脚本。

该模型支持单机单卡训练和单机8卡训练。

单机单卡训练

启动单卡训练。

# training 1p accuracy
bash ./test/train_full_1p.sh --data_path=xxx --device_id=xxx
# --data_path=data/VOCdevkit/VOC2012
# --device_id 指定训练用卡，可选0，1，2，3，4，5，6，7

# training 1p performance
bash ./test/train_performance_1p.sh --data_path=xxx --device_id=xxx

单机8卡训练

启动8卡训练。

# training 8p accuracy
bash ./test/train_full_8p.sh --data_path=xxx 

# training 8p performance
bash ./test/train_performance_8p.sh --data_path=xxx 

# evaluation 8p accuracy
bash ./test/train_val_8p.sh --data_path=xxx

多机多卡性能数据获取流程

    1. 安装环境
    2. 开始训练，每个机器所请按下面提示进行配置
        bash ./test/train_performance_multinodes.sh  --data_path=数据集路径 --batch_size=单卡batch_size --nnodes=机器总数量 --node_rank=当前机器rank(0,1,2..) --local_addr=当前机器IP(需要和master_addr处于同一网段) --master_addr=主节点IP

--data_path参数填写数据集路径。

模型训练脚本参数说明如下。

公共参数：
--device                            //指定gpu或npu
--data_path                         //数据集路径
--addr                              //主机地址     
--amp                               //是否使用混合精度
--loss-scale                        //混合精度lossscale大小
--opt-level                         //混合精度类型
多卡训练参数：
--device-list '0,1,2,3,4,5,6,7'     //多卡训练指定训练用卡

日志和权重文件保存在如下路径。

./output/devie_id/FCN/train_${device_id}.log          # training detail log
./output/devie_id/FCN/FCN_bs16_8p_acc.log             # 8p training performance result log
./output/devie_id/FCN/ckpt                            # checkpoits
./output/devie_id/FCN_prof/FCN_bs16_8p_acc.log        # 8p training accuracy result log

训练结果展示

表 2 训练结果展示表

名称	FPS	aAcc	mIoU	mAcc
1p-竞品	-----	-----	-----	-----
1p-NPU	28.46	90.73	59.61	72.01
8p-竞品	135.19	93.23	69.36	78.88
8p-NPU	193.15	93.06	68.41	77.39

版本说明

变更

2022.09.06：更新内容，重新发布。

2020.07.08：首次发布。

已知问题

无。

公网地址说明

代码涉及公网地址参考 public_address_statement.md

使用模型资源和服务前，请您仔细阅读并理解透彻《昇腾深度学习模型许可协议 3.0》

FCN8s-PyTorch

概述

简述

准备训练环境

准备环境

准备数据集

开始训练

训练模型

训练结果展示

版本说明

变更

已知问题

公网地址说明

关于昇腾

新闻与活动

交流与资讯

支持与服务

开源社区

About Ascend

Communication and Information

Links