模型详情

概述

简述

PSPNet,利用FCN中嵌入了不同场景的上下文特征。相比于FCN,语义分割性能由显著的提升。本文档描述的是PSPNet在Pytorch框架下实现的版本。

  • 参考实现:

    url=https://github.com/open-mmlab/mmsegmentation.git
    commit_id=9f071cade8cdc59c13b416c7c9843005410c055c
  • 适配昇腾 AI 处理器的实现:

    url=https://gitee.com/ascend/ModelZoo-PyTorch.git
    code_path=PyTorch/contrib/cv/semantic_segmentation
  • 通过Git获取代码方法如下:

    git clone {url}    # 克隆仓库的代码
    cd  {code_path}    # 切换到模型代码所在路径,若仓库下只有该模型,则无需切换
  • 通过单击“立即下载”,下载源码包。

准备训练环境

准备环境

  • 当前模型支持的固件与驱动、 CANN 以及 PyTorch 如下表所示。

    表 1 版本配套表

    配套 版本
    固件与驱动 5.1.RC2
    CANN 5.1.RC2
    PyTorch 1.8.1
  • 环境准备指导。

    请参考《Pytorch框架训练环境准备》。

  • 安装依赖。

    pip install -r requirements.txt
  • 构建mmcv 。

    下载mmcv=1.2.7到$YOURMODELZOO(用户自定义目录) ,进入到源码包 根目录下,将mmcv_replace/目录下的文件替换到 $YOURMMVCPATH/mmcv安装目录下。

    cd /${模型文件夹名称}
    
    # configure
    source env_npu.sh
    
    # copy
    rm -rf $YOURMMVCPATH/mmcv
    mkdir $YOURMMVCPATH/mmcv
    cp -r $PSPNET/mmcv_replace/* $YOURMMVCPATH/mmcv/
    
    # compile
    cd $YOURMMVCPATH
    export MMCV_WITH_OPS=1
    export MAX_JOBS=8
    python3 setup.py build_ext
    python3 setup.py develop
    pip3.7.5 list | grep mmcv
    
    cd /${模型文件夹名称}
  • 权限配置。

    chmod -R 777 ./
  • 删除mmcv_replace文件夹。

    rm -rf mmcv_replace

准备数据集

  1. 获取数据集。
  • 下载PASCAL VOC 2012 数据集和PASCAL VOC2010 数据集的训练和验证集。

    解压后的数据集结构为:

    ├── VOCdevkit
    │   │   ├── VOC2012
    │   │   ├── VOC2010
  • 在数据集目录下新建VOCaug/目录,下载PASCALAug 数据集。
    解压后,复制benchmark_REALSE/dataset到文件夹VOCaug中。

    ├── VOCdevkit
    │   │   ├── VOC2012
    │   │   ├── VOC2010
    │   │   ├── VOCaug
  1. 数据预处理。
  • 使用以下命令转换 VOCAug 数据集。

    cd /${模型文件夹名称}
    python tools/convert_datasets/voc_aug.py data/VOCdevkit data/VOCdevkit/VOCaug --nproc 8
  • [可选] 将数据集软链接到 mmseg100 的文件夹。

    cd /${模型文件夹名称}
    mkdir data
    ln -s VOCdevkit data # data_path=./data/VOCdevkit/VOC2012

开始训练

训练模型

  1. 进入解压后的源码包根目录。

       cd /${模型文件夹名称}
  2. 运行训练脚本。

    该模型支持单机单卡训练和单机8卡训练。

    • 单机单卡训练

      启动单卡训练。

      ```
      # training 1p accuracy
      bash ./test/train_full_1p.sh --data_path=xxx
      # --data_path=data/VOCdevkit/VOC2012 
      ```
    • 单机8卡训练

      启动8卡训练。

      ```
      # training 8p accuracy
      bash ./test/train_full_8p.sh --data_path=xxx
      # --data_path=data/VOCdevkit/VOC2012 
      ```
    • 多机多卡性能数据获取流程

          1. 安装环境
          2. 开始训练,每个机器所请按下面提示进行配置
              bash ./test/train_performance_multinodes.sh  --data_path=数据集路径 --batch_size=单卡batch_size --nnodes=机器总数量 --node_rank=当前机器rank(0,1,2..) --local_addr=当前机器IP(需要和master_addr处于同一网段) --master_addr=主节点IP

    --data_path参数填写数据集路径。

模型训练脚本参数说明如下。

公共参数:
--device                            //指定gpu或npu
--data_path                         //数据集路径
--addr                              //主机地址     
--amp                               //是否使用混合精度
--loss-scale                        //混合精度lossscale大小
--opt-level                         //混合精度类型
多卡训练参数:
--device-list '0,1,2,3,4,5,6,7'     //多卡训练指定训练用卡

日志和检查点路径:

./output/devie_id/PSPNet/train_${device_id}.log             # training detail log
./output/devie_id/PSPNet/PSPNet_bs16_8p_acc.log             # 8p training performance result log
./output/devie_id/PSPNet/ckpt                               # checkpoits
./output/devie_id/PSPNet_prof/PSPNet_bs16_8p_acc.log        # 8p training accuracy result log

训练结果展示

表 2 训练结果展示表

device fps aAcc mIoU mAcc
8p-竞品 82.296 94.92 77.13 85.7
8p-1.5 117.808 94.71 77.04 86.52
8p-1.8 119.84 94.23 75.22 85.07

版本说明

变更

2020.10.14:更新内容,重新发布。

2020.07.08:首次发布。

已知问题

无。

公网地址说明

代码涉及公网地址参考 public_address_statement.md

使用模型资源和服务前,请您仔细阅读并理解透彻《昇腾深度学习模型许可协议 3.0》
该页面对您有帮助吗?
我要评分