GLIP-PyTorch

概述

简述

GLIP是一种用于视觉定位的语言-图像预训练模型，可以学习对象级、语言感知和语义丰富的视觉表示。GLIP统一了预训练的对象检测和短语定位。统一框架带来了两个优点，1）允许GLIP从检测和定位数据中学习，以提高这两项任务的精度并得到一个优秀的定位模型，2）GLIP可以通过自训练的范式利用大量的图文对生成定位框，得到语义丰富的特征。实验证明，GLIP具有强大的零样本、少样本迁移能力。

参考实现：

  url=https://github.com/microsoft/GLIP/
  commit_id=a5f302bfd4c5c67010e29f779e3b0bde94e89985

适配昇腾 AI 处理器的实现：

  url=https://gitee.com/ascend/ModelZoo-PyTorch.git
  code_path=PyTorch/built-in/others

准备训练环境

准备环境

当前模型支持的 PyTorch 版本和已知三方库依赖如下表所示。

表 1 版本支持表

Torch_Version 三方库依赖版本

PyTorch 1.11 mmcv-full==1.7.1;
环境准备指导。

请参考《Pytorch框架训练环境准备》。
安装依赖。

在模型源码包根目录下执行命令，安装模型对应PyTorch版本需要的依赖。
```
pip install -r requirements.txt
python setup.py build develop
```

Torch_Version	三方库依赖版本
PyTorch 1.11	mmcv-full==1.7.1;

准备训练数据集

使用coco2017数据集。准备好数据集后放到 /${模型文件夹名称} 目录下，并重命名为coco

├── coco
      ├── annotations               
          ├── instances_train2017.json
          ├── instances_val2017.json ...
      ├── train2017
          ├── 000000******.jpg ...
      ├── val2017
          ├── 000000******.jpg ...

说明： 该数据集的训练过程脚本只作为一种参考示例。

准备预训练模型

下载预训练模型glip_tiny_model_o365_goldg_cc_sbu.pth，路径为/${模型文件夹名称}/pretrain/glip_tiny_model_o365_goldg_cc_sbu.pth。

开始训练

训练模型

进入解压后的源码包根目录。
```
cd /${模型文件夹名称} 
```

运行训练脚本。

该模型支持单机单卡训练、单机8卡训练。

单机单卡训练

启动单卡训练：

bash test/train_full_1p.sh         #单卡训练

bash test/train_performance_1p.sh  #单卡性能测试

单机8卡训练

启动8卡训练：

bash test/train_full_8p.sh          #多卡训练

bash test/train_performance_8p.sh   #多卡性能测试

模型训练脚本参数说明如下。

   --config-file                  //配置文件
   --override_output_dir          //结果保存路径
   MODEL.WEIGHT                   //预训练权重路径
   SOLVER.IMS_PER_BATCH           //训练批次大小
   SOLVER.USE_AMP                 //使能混精训练
   SOLVER.MAX_EPOCH               //训练epoch数

训练完成后，权重文件保存在OUTPUT路径下，并输出模型训练精度和性能信息。

训练结果展示

表 2 训练结果展示表

NAME	mAP	FPS	Epochs	Batch Size
1p-NPU	-		-	1
1p-竞品V	-		-	1
1p-竞品A	-	1.1303	-	1
8p-NPU	54.5	6.6492	3	8
8p-竞品V	54.6	6.5472	3	8
8p-竞品A	54.7	8.1739	3	8

版本说明

变更

2023.09.08：首次发布。

FAQ

无。

公网地址说明

代码涉及公网地址参考 public_address_statement.md 、DATA.md 及 README_RAW.md

使用模型资源和服务前，请您仔细阅读并理解透彻《昇腾深度学习模型许可协议 3.0》

GLIP-PyTorch

概述

简述

准备训练环境

准备环境

准备训练数据集

准备预训练模型

开始训练

训练模型

训练结果展示

版本说明

变更

FAQ

公网地址说明

关于昇腾

新闻与活动

交流与资讯

支持与服务

开源社区

About Ascend

Communication and Information

Links