下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

模型后处理配置参数

本章节介绍各个模型所需要的配置参数。

表1 YOLOv3模型后处理配置参数(yolov3_tf_bs1_fp16.cfg)

参数名

描述

默认值

取值区间

CLASS_NUM

类别数量。

80

BIASES_NUM

anchor宽高的数量(18表示9个anchor,每个对应一对宽高值)。

18

[0, 100]

BIASE

每两个数组成一个anchor的宽高值,例如10、13表示第一个anchor的宽、高值。

10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326

SCORE_THRESH

目标是否为某种类别物体的阈值,大于阈值即认为是该目标。

0.3

[0.0, 1.0]

OBJECTNESS_THRESH

是否为目标的阈值,大于阈值即认为是目标。

0.3

[0.0, 1.0]

IOU_THRESH

两个框的IOU阈值,超过阈值即认为同一个框。

0.45

[0.0, 1.0]

YOLO_TYPE

表示输出Tensor的个数,3表示有三个feature map输出。

3

[0, 16]

ANCHOR_DIM

每个feature map对应的anchor框数量。

3

[0, 16]

MODEL_TYPE

数据排布格式,0表示NHWC,1表示NCHW,2表示NCHWC。

0

FRAMEWORK

String类型,可选值有MindSpore,PyTorch,TensorFlow 和Caffe。

TensorFlow

SEPARATE_SCORE_THRESH

各个类别对应的阈值。

CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。)

表2 ResNet-50模型后处理配置参数(resnet50_aipp_tf.cfg)

参数名

描述

默认值

取值区间

CLASS_NUM

类别数量。

1001

[0, 2000]

SOFTMAX

布尔型,是否需要在后处理中做softmax计算。

false

TOP_K

前K个可能性最大的类。

1

[0, 16]

表3 FasterRcnn模型后处理配置参数(faster_rcnn_uncut.cfg)

参数名

描述

默认值

取值区间

CLASS_NUM

类别数量。

91

[0, 1000]

SCORE_THRESH

目标是否为某种类别物体的阈值,大于阈值即认为是该目标。

0.5

[0.0, 1.0]

IOU_THRESH

两个框的IOU阈值,超过阈值即认为同一个框。

0.45

[0.0, 1.0]

SEPARATE_SCORE_THRESH

各个类别对应的阈值。

CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。)

MODEL_TYPE

可选以下三个值:

0:original

1:nms_cut(模型未做非极大值抑制)

2:FPN

0

FRAMEWORK

可选以下三个值:

  • TensorFlow
  • MindSpore
  • Pytorch

TensorFlow

NMS_FINISHED

modelinfer框架特有的属性值,为布尔值:

  • false:模型本身不存在NMS算子,需后处理进行NMS操作。
  • true:模型本身存在NMS算子,不需后处理进行NMS操作。

true

:“MODEL_TYPE”和“FRAMEWORK”参数配套说明如下:

  • orginal配套TensorFlow框架。
  • nms_cut配套TensorFlow或MindSpore框架。
  • FPN配套Pytorch框架。
表4 ssd_vgg模型后处理配置参数(ssd_vgg16_caffe_release.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

5

SCORE_THRESH

目标阈值。

0.4

SEPARATE_SCORE_THRESH

各个类别对应的阈值。

CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。)

表5 Ssd-Mobilenet-v1-Fpn模型后处理配置参数(ssd_mobilenetv1_fpn.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

3

SCORE_THRESH

目标是否为某种类别物体的阈值,大于阈值即认为是该目标。

0.5

SEPARATE_SCORE_THRESH

各个类别对应的阈值。

CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。)

表6 CRNN模型后处理配置参数(crnn_ssh_2.cfg)

参数名

描述

默认值

取值区间

CLASS_NUM

类别数量。

0

[0, 10000]

OBJECT_NUM

可检测的字符数上限。

0

[0, 1000]

BLANK_INDEX

空白符的索引值。

0

[0, 10000]

WITH_ARGMAX

模型backbone是否已经做了argmax。

false

表7 modelinfer框架ResNet特征模型后处理配置参数(resnet_feature_caffe_release.cfg)

参数名

描述

默认值

ACTIVATION_FUNCTION

用来激活模型输出数据的激活函数。

None

表8 modelinfer框架ResNet多分类属性模型后处理配置参数(resnet_attribute_caffe_release.cfg)

参数名

描述

默认值

ATTRIBUTE_NUM

模型输出属性的数量。

5

ACTIVATION_FUNCTION

激活函数的类型,目前仅支持sigmoid函数。

ATTRIBUTE_INDEX

模型输出属性的索引。请确保索引的数量与ATTRIBUTE_NUM值相等。

表9 modelinfer框架ResNet二分类属性模型后处理配置参数(resnet_attribute_caffe_release.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

5

表10 modelinfer框架YOLOv4模型后处理配置参数(yolov4_pt_bs1_fp16.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

80

BIASES_NUM

anchor宽高的数量(18表示9个anchor,每个对应一对宽高值)

18

BIASES

每两个数组成一个anchor的宽高值,例如10、13表示第一个anchor的宽、高值。

10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326

SCORE_THRESH

目标是否为某种类别物体的阈值,大于阈值即认为是该目标。

0.3

OBJECTNESS_THRESH

是否为目标的阈值,大于阈值即认为是目标。

0.3

IOU_THRESH

两个框的IOU阈值,超过阈值即认为同一个框。

0.45

YOLO_TYPE

表示输出Tensor的个数,3表示有三个feature map输出。

3

ANCHOR_DIM

每个feature map对应的anchor框数量。

3

MODEL_TYPE

数据排布格式,0表示NHWC,1表示NCHW。

0

FRAMEWORK_TYPE

模型框架,0表示Pytorch,1表示MindSpore。

0

SEPARATE_SCORE_THRESH

各个类别对应的阈值。

CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。)

表11 YOLOv4模型后处理配置参数(yolov4_pt_bs1_fp16.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

80

BIASES_NUM

anchor宽高的数量(18表示9个anchor,每个对应一对宽高值)。

18

BIASES

每两个数组成一个anchor的宽高值,例如10、13表示第一个anchor的宽、高值。

10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326

SCORE_THRESH

目标是否为某种类别物体的阈值,大于阈值即认为是该目标。

0.3

OBJECTNESS_THRESH

是否为目标的阈值,大于阈值即认为是目标。

0.3

IOU_THRESH

两个框的IOU阈值,超过阈值即认为同一个框。

0.45

YOLO_TYPE

表示输出Tensor的个数,3表示有三个feature map输出。

3

ANCHOR_DIM

每个feature map对应的anchor框数量。

3

MODEL_TYPE

数据排布格式,0表示NHWC,1表示NCHW,2表示NCHWC。

0

FRAMEWORK

String类型,可选值有MindSpore,PyTorch,TensorFlow 和Caffe。

MindSpore

SEPARATE_SCORE_THRESH

各个类别对应的阈值。

CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。)

YOLO_VERSION

使用的yolo模型版本。

(必选)YOLO_VERSION=4

表12 YOLOv5模型后处理配置参数(yolov5_pt_bs1_fp32.cfg)

参数名

描述

默认值

取值空间

CLASS_NUM

类别数量。

80

[0, 1000]

BIASES_NUM

anchor宽高的数量(18表示9个anchor,每个对应一对宽高值)。

18

[0, 1000]

BIASE

每两个数组成一个anchor的宽高值,例如10、13表示第一个anchor的宽、高值。

10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326

SCORE_THRESH

目标是否为某种类别物体的阈值,大于阈值即认为是该目标。

0.3

[0.0, 1.0]

OBJECTNESS_THRESH

是否为目标的阈值,大于阈值即认为是目标。

0.3

[0.0, 1.0]

IOU_THRESH

两个框的IOU阈值,超过阈值即认为同一个框。

0.45

[0.0, 1.0]

YOLO_TYPE

表示输出Tensor的个数,3表示有三个feature map输出。

3

[0, 1000]

ANCHOR_DIM

每个feature map对应的anchor框数量。

3

[0, 1000]

MODEL_TYPE

数据排布格式,0表示NHWC,1表示NCHW,2表示NCHWC(当前仅支持的PyTorch框架模型)。

2

[0, 1000]

FRAMEWORK

String类型,可选值有MindSpore,PyTorch,TensorFlow 和Caffe。

PyTorch

SEPARATE_SCORE_THRESH

各个类别对应的阈值。

CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。)

YOLO_VERSION

使用的yolo模型版本。

(必选)YOLO_VERSION=5

表13 modelinfer框架FasterRCNN-Fpn/CascadeRCNN-Fpn模型后处理配置参数(fasterrcnn.cfg或cascadercnn.cfg)

参数名

描述

默认值

SCORE_THRESH

目标是否为某种类别物体的阈值,大于阈值即认为是该目标,实验使用0.3。

0.5

FPN_SWITCH

FPN开关,这两个模型均要设为true。

false

表14 DeepLabV3+(TensorFlow)模型后处理配置参数(deeplabv3.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

21

FRAMEWORK_TYPE

深度学习框架类型选择。

TensorFlow框架选择0

表15 CTPN模型后处理配置参数(ctpn_tf.cfg)

参数名

描述

默认值

取值区间

IS_ORIENTED

是否进行检测框倾斜。

false

BOX_IOU_THRESH

检测小框的iou阈值。

0.7

[0.0, 1.0]

TEXT_IOU_THRESH

最终文本框的iou阈值。

0.2

[0.0, 1.0]

TEXT_PROPOSALS_MIN_SCORE

检测小框的最小分数过滤。

0.7

[0.0, 1.0]

LINE_MIN_SCORE

最终文本框的最小分数过滤。

0.9

[0.0, 1.0]

IS_MINDSPORE

是否为MindSpore框架。

false

表16 CTPN模型后处理配置参数(ctpn_mindspore.cfg)

参数名

描述

默认值

取值区间

IS_ORIENTED

是否进行检测框倾斜。

false

BOX_IOU_THRESH

检测小框的iou阈值。

0.7

[0.0, 1.0]

TEXT_IOU_THRESH

最终文本框的iou阈值。

0.2

[0.0, 1.0]

TEXT_PROPOSALS_MIN_SCORE

检测小框的最小分数过滤。

0.7

[0.0, 1.0]

LINE_MIN_SCORE

最终文本框的最小分数过滤。

0.9

[0.0, 1.0]

IS_MINDSPORE

是否为MindSpore框架。

true

表17 ResNet-18模型后处理配置参数(resnet18_aipp_tf.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

2

表18 DeepLabv3(MindSpore)模型后处理配置参数(deeplabv3.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

21

MODEL_TYPE

模型推理输出数据的排布格式,0表示NHWC,1表示NCHW。

1

FRAMEWORK_TYPE

深度学习框架类型选择。

MindSpore框架选择2

表19 BERT-Base (Uncased) 模型后处理配置参数(bert.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

2

CHECK_MODEL

检查模型兼容性。

false

表20 DeepLabV3+(Pytorch)模型后处理配置参数(deeplabv3.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

21

CHECK_MODEL

检查模型兼容性。

true

MODEL_TYPE

模型推理输出数据的排布格式,0表示NHWC,1表示NCHW。

1

FRAMEWORK_TYPE

深度学习框架类型选择。

Pytorch框架选择1

表21 U-Net模型后处理配置参数(unet_simple.cfg)

参数名

描述

默认值

CLASS_NUM

类别数量。

2

POST_TYPE

模型后处理方式,0表示对模型logits输出(NHWC型)做argmax,1表示对模型argmax输出结果(NHW型)透传。

1

RESIZE_TYPE

对像素图做插值还原的方式,暂只支持两种方式:

0:不做插值还原。

1:最邻近插值还原。

1

表22 Mask R-CNN模型后处理配置参数(mask_rcnn_2017.cfg)

参数名

描述

默认值

取值区间

CLASS_NUM

推理类别总数,背景不计算在内。

80

[0, 100]

SCORE_THRESH

置信度得分阈值,可根据业务场景调整。

0.7

[0.0, 1.0]

IOU_THRESH

IOU阈值,可根据业务场景调整。

0.5

[0.0, 1.0]

RPN_MAX_NUM

Region Proposal Network最大个数。

1000

[0, 1000]

MAX_PER_IMG

按置信度排序,每张图预测框的最大值。

128

[0, 150]

MASK_THREAD_BINARY

输入RCNN的掩码阈值。

0.5

[0.0, 1.0]

MASK_SHAPE_SIZE

mask_rcnn中掩码的形状,只支持单参数表示正方形。

28

[0, 100]

MODEL_TYPE

可选以下两个值。

0:MindSpore

1:Pytorch

0

SEPARATE_SCORE_THRESH

各个类别对应的阈值。

CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。)

表23 Ssd_Mobilenet_v1_Fpn_for_MindSpore模型后处理配置参数(ssd_mobilenetv1_fpn.cfg)

参数名

描述

默认值

取值区间

CLASS_NUM

类别数量。

81

[0, 100]

SCORE_THRESH

目标是否为某种类别物体的阈值,大于阈值即认为是该目标。

0.5

[0.0, 1.0]

IOU_THRESH

目标重合程度的阈值,大于阈值即认为两个目标框对应同一个目标。

0.6

[0.0, 1.0]

SEPARATE_SCORE_THRESH

各个类别对应的阈值。

CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。)

表24 OpenPose模型后处理配置参数(openpose.cfg)

参数名

描述

默认值

取值区间

KEYPOINT_NUM

关键点个数,加上背景(背景算一个)。

19

[0, 100]

FILTER_SIZE

高斯滤波核的长(或宽)。

25

[0, 100]

SIGMA

高斯滤波核的方差。

3

[0, 10]

表25 HigherHRnet模型后处理配置参数(higherhrnet.cfg)

参数名

描述

默认值

取值区间

KEYPOINT_NUM

关键点个数。

17

[0, 20]

SCORE_THRESH

关键点阈值。

0.1

[0.0, 1.0]

表26 Unet++模型后处理配置参数(unet_nested.cfg)

参数名

描述

默认值

取值区间

CLASS_NUM

类别数量。

3

POST_TYPE

模型后处理方式,0表示对模型logits输出(NHWC型)做argmax,1表示对模型argmax输出结果(NHW型)透传。

1

[0, 16]

RESIZE_TYPE

对像素图做插值还原的方式,暂只支持两种方式:

0:不做插值还原。

1:最邻近插值还原。

1

[0, 16]

表27 RetinaNet模型后处理配置参数(retinanet_tf.cfg)

参数名

描述

默认值

取值区间

CLASS_NUM

代表数据集类别数量(默认COCO数据集是80类)。

80

[0, 100]

MODEL_TYPE

代表模型类别,目前仅支持TensorFlow模型。

0

[0, 100]

SCORE_THRESH

代表分数阈值。

0.5

[0.0, 1.0]

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词