模型后处理配置参数
本章节介绍各个模型所需要的配置参数。
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
CLASS_NUM |
类别数量。 |
80 |
无 |
BIASES_NUM |
anchor宽高的数量(18表示9个anchor,每个对应一对宽高值)。 |
18 |
[0, 100] |
BIASE |
每两个数组成一个anchor的宽高值,例如10、13表示第一个anchor的宽、高值。 |
10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326 |
无 |
SCORE_THRESH |
目标是否为某种类别物体的阈值,大于阈值即认为是该目标。 |
0.3 |
[0.0, 1.0] |
OBJECTNESS_THRESH |
是否为目标的阈值,大于阈值即认为是目标。 |
0.3 |
[0.0, 1.0] |
IOU_THRESH |
两个框的IOU阈值,超过阈值即认为同一个框。 |
0.45 |
[0.0, 1.0] |
YOLO_TYPE |
表示输出Tensor的个数,3表示有三个feature map输出。 |
3 |
[0, 16] |
ANCHOR_DIM |
每个feature map对应的anchor框数量。 |
3 |
[0, 16] |
MODEL_TYPE |
数据排布格式,0表示NHWC,1表示NCHW,2表示NCHWC。 |
0 |
无 |
FRAMEWORK |
String类型,可选值有MindSpore,PyTorch,TensorFlow 和Caffe。 |
TensorFlow |
无 |
SEPARATE_SCORE_THRESH |
各个类别对应的阈值。 |
CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。) |
无 |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
CLASS_NUM |
类别数量。 |
1001 |
[0, 2000] |
SOFTMAX |
布尔型,是否需要在后处理中做softmax计算。 |
false |
无 |
TOP_K |
前K个可能性最大的类。 |
1 |
[0, 16] |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
CLASS_NUM |
类别数量。 |
91 |
[0, 1000] |
SCORE_THRESH |
目标是否为某种类别物体的阈值,大于阈值即认为是该目标。 |
0.5 |
[0.0, 1.0] |
IOU_THRESH |
两个框的IOU阈值,超过阈值即认为同一个框。 |
0.45 |
[0.0, 1.0] |
SEPARATE_SCORE_THRESH |
各个类别对应的阈值。 |
CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。) |
无 |
MODEL_TYPE |
可选以下三个值: 0:original 1:nms_cut(模型未做非极大值抑制) 2:FPN |
0 |
无 |
FRAMEWORK |
可选以下三个值:
|
TensorFlow |
无 |
NMS_FINISHED |
modelinfer框架特有的属性值,为布尔值:
|
true |
无 |
注:“MODEL_TYPE”和“FRAMEWORK”参数配套说明如下:
|
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
5 |
SCORE_THRESH |
目标阈值。 |
0.4 |
SEPARATE_SCORE_THRESH |
各个类别对应的阈值。 |
CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。) |
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
3 |
SCORE_THRESH |
目标是否为某种类别物体的阈值,大于阈值即认为是该目标。 |
0.5 |
SEPARATE_SCORE_THRESH |
各个类别对应的阈值。 |
CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。) |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
CLASS_NUM |
类别数量。 |
0 |
[0, 10000] |
OBJECT_NUM |
可检测的字符数上限。 |
0 |
[0, 1000] |
BLANK_INDEX |
空白符的索引值。 |
0 |
[0, 10000] |
WITH_ARGMAX |
模型backbone是否已经做了argmax。 |
false |
无 |
参数名 |
描述 |
默认值 |
---|---|---|
ACTIVATION_FUNCTION |
用来激活模型输出数据的激活函数。 |
None |
参数名 |
描述 |
默认值 |
---|---|---|
ATTRIBUTE_NUM |
模型输出属性的数量。 |
5 |
ACTIVATION_FUNCTION |
激活函数的类型,目前仅支持sigmoid函数。 |
无 |
ATTRIBUTE_INDEX |
模型输出属性的索引。请确保索引的数量与ATTRIBUTE_NUM值相等。 |
无 |
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
5 |
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
80 |
BIASES_NUM |
anchor宽高的数量(18表示9个anchor,每个对应一对宽高值) |
18 |
BIASES |
每两个数组成一个anchor的宽高值,例如10、13表示第一个anchor的宽、高值。 |
10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326 |
SCORE_THRESH |
目标是否为某种类别物体的阈值,大于阈值即认为是该目标。 |
0.3 |
OBJECTNESS_THRESH |
是否为目标的阈值,大于阈值即认为是目标。 |
0.3 |
IOU_THRESH |
两个框的IOU阈值,超过阈值即认为同一个框。 |
0.45 |
YOLO_TYPE |
表示输出Tensor的个数,3表示有三个feature map输出。 |
3 |
ANCHOR_DIM |
每个feature map对应的anchor框数量。 |
3 |
MODEL_TYPE |
数据排布格式,0表示NHWC,1表示NCHW。 |
0 |
FRAMEWORK_TYPE |
模型框架,0表示Pytorch,1表示MindSpore。 |
0 |
SEPARATE_SCORE_THRESH |
各个类别对应的阈值。 |
CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。) |
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
80 |
BIASES_NUM |
anchor宽高的数量(18表示9个anchor,每个对应一对宽高值)。 |
18 |
BIASES |
每两个数组成一个anchor的宽高值,例如10、13表示第一个anchor的宽、高值。 |
10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326 |
SCORE_THRESH |
目标是否为某种类别物体的阈值,大于阈值即认为是该目标。 |
0.3 |
OBJECTNESS_THRESH |
是否为目标的阈值,大于阈值即认为是目标。 |
0.3 |
IOU_THRESH |
两个框的IOU阈值,超过阈值即认为同一个框。 |
0.45 |
YOLO_TYPE |
表示输出Tensor的个数,3表示有三个feature map输出。 |
3 |
ANCHOR_DIM |
每个feature map对应的anchor框数量。 |
3 |
MODEL_TYPE |
数据排布格式,0表示NHWC,1表示NCHW,2表示NCHWC。 |
0 |
FRAMEWORK |
String类型,可选值有MindSpore,PyTorch,TensorFlow 和Caffe。 |
MindSpore |
SEPARATE_SCORE_THRESH |
各个类别对应的阈值。 |
CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。) |
YOLO_VERSION |
使用的yolo模型版本。 |
(必选)YOLO_VERSION=4 |
参数名 |
描述 |
默认值 |
取值空间 |
---|---|---|---|
CLASS_NUM |
类别数量。 |
80 |
[0, 1000] |
BIASES_NUM |
anchor宽高的数量(18表示9个anchor,每个对应一对宽高值)。 |
18 |
[0, 1000] |
BIASE |
每两个数组成一个anchor的宽高值,例如10、13表示第一个anchor的宽、高值。 |
10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326 |
无 |
SCORE_THRESH |
目标是否为某种类别物体的阈值,大于阈值即认为是该目标。 |
0.3 |
[0.0, 1.0] |
OBJECTNESS_THRESH |
是否为目标的阈值,大于阈值即认为是目标。 |
0.3 |
[0.0, 1.0] |
IOU_THRESH |
两个框的IOU阈值,超过阈值即认为同一个框。 |
0.45 |
[0.0, 1.0] |
YOLO_TYPE |
表示输出Tensor的个数,3表示有三个feature map输出。 |
3 |
[0, 1000] |
ANCHOR_DIM |
每个feature map对应的anchor框数量。 |
3 |
[0, 1000] |
MODEL_TYPE |
数据排布格式,0表示NHWC,1表示NCHW,2表示NCHWC(当前仅支持的PyTorch框架模型)。 |
2 |
[0, 1000] |
FRAMEWORK |
String类型,可选值有MindSpore,PyTorch,TensorFlow 和Caffe。 |
PyTorch |
无 |
SEPARATE_SCORE_THRESH |
各个类别对应的阈值。 |
CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。) |
无 |
YOLO_VERSION |
使用的yolo模型版本。 |
(必选)YOLO_VERSION=5 |
无 |
参数名 |
描述 |
默认值 |
---|---|---|
SCORE_THRESH |
目标是否为某种类别物体的阈值,大于阈值即认为是该目标,实验使用0.3。 |
0.5 |
FPN_SWITCH |
FPN开关,这两个模型均要设为true。 |
false |
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
21 |
FRAMEWORK_TYPE |
深度学习框架类型选择。 |
TensorFlow框架选择0 |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
IS_ORIENTED |
是否进行检测框倾斜。 |
false |
无 |
BOX_IOU_THRESH |
检测小框的iou阈值。 |
0.7 |
[0.0, 1.0] |
TEXT_IOU_THRESH |
最终文本框的iou阈值。 |
0.2 |
[0.0, 1.0] |
TEXT_PROPOSALS_MIN_SCORE |
检测小框的最小分数过滤。 |
0.7 |
[0.0, 1.0] |
LINE_MIN_SCORE |
最终文本框的最小分数过滤。 |
0.9 |
[0.0, 1.0] |
IS_MINDSPORE |
是否为MindSpore框架。 |
false |
无 |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
IS_ORIENTED |
是否进行检测框倾斜。 |
false |
无 |
BOX_IOU_THRESH |
检测小框的iou阈值。 |
0.7 |
[0.0, 1.0] |
TEXT_IOU_THRESH |
最终文本框的iou阈值。 |
0.2 |
[0.0, 1.0] |
TEXT_PROPOSALS_MIN_SCORE |
检测小框的最小分数过滤。 |
0.7 |
[0.0, 1.0] |
LINE_MIN_SCORE |
最终文本框的最小分数过滤。 |
0.9 |
[0.0, 1.0] |
IS_MINDSPORE |
是否为MindSpore框架。 |
true |
无 |
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
2 |
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
21 |
MODEL_TYPE |
模型推理输出数据的排布格式,0表示NHWC,1表示NCHW。 |
1 |
FRAMEWORK_TYPE |
深度学习框架类型选择。 |
MindSpore框架选择2 |
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
2 |
CHECK_MODEL |
检查模型兼容性。 |
false |
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
21 |
CHECK_MODEL |
检查模型兼容性。 |
true |
MODEL_TYPE |
模型推理输出数据的排布格式,0表示NHWC,1表示NCHW。 |
1 |
FRAMEWORK_TYPE |
深度学习框架类型选择。 |
Pytorch框架选择1 |
参数名 |
描述 |
默认值 |
---|---|---|
CLASS_NUM |
类别数量。 |
2 |
POST_TYPE |
模型后处理方式,0表示对模型logits输出(NHWC型)做argmax,1表示对模型argmax输出结果(NHW型)透传。 |
1 |
RESIZE_TYPE |
对像素图做插值还原的方式,暂只支持两种方式: 0:不做插值还原。 1:最邻近插值还原。 |
1 |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
CLASS_NUM |
推理类别总数,背景不计算在内。 |
80 |
[0, 100] |
SCORE_THRESH |
置信度得分阈值,可根据业务场景调整。 |
0.7 |
[0.0, 1.0] |
IOU_THRESH |
IOU阈值,可根据业务场景调整。 |
0.5 |
[0.0, 1.0] |
RPN_MAX_NUM |
Region Proposal Network最大个数。 |
1000 |
[0, 1000] |
MAX_PER_IMG |
按置信度排序,每张图预测框的最大值。 |
128 |
[0, 150] |
MASK_THREAD_BINARY |
输入RCNN的掩码阈值。 |
0.5 |
[0.0, 1.0] |
MASK_SHAPE_SIZE |
mask_rcnn中掩码的形状,只支持单参数表示正方形。 |
28 |
[0, 100] |
MODEL_TYPE |
可选以下两个值。 0:MindSpore 1:Pytorch |
0 |
无 |
SEPARATE_SCORE_THRESH |
各个类别对应的阈值。 |
CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。) |
无 |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
CLASS_NUM |
类别数量。 |
81 |
[0, 100] |
SCORE_THRESH |
目标是否为某种类别物体的阈值,大于阈值即认为是该目标。 |
0.5 |
[0.0, 1.0] |
IOU_THRESH |
目标重合程度的阈值,大于阈值即认为两个目标框对应同一个目标。 |
0.6 |
[0.0, 1.0] |
SEPARATE_SCORE_THRESH |
各个类别对应的阈值。 |
CLASS_NUM(数量)个SCORE_THRESH(阈值),以逗号为分隔符。(阈值数量等于CLASS_NUM。) |
无 |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
KEYPOINT_NUM |
关键点个数,加上背景(背景算一个)。 |
19 |
[0, 100] |
FILTER_SIZE |
高斯滤波核的长(或宽)。 |
25 |
[0, 100] |
SIGMA |
高斯滤波核的方差。 |
3 |
[0, 10] |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
KEYPOINT_NUM |
关键点个数。 |
17 |
[0, 20] |
SCORE_THRESH |
关键点阈值。 |
0.1 |
[0.0, 1.0] |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
CLASS_NUM |
类别数量。 |
3 |
无 |
POST_TYPE |
模型后处理方式,0表示对模型logits输出(NHWC型)做argmax,1表示对模型argmax输出结果(NHW型)透传。 |
1 |
[0, 16] |
RESIZE_TYPE |
对像素图做插值还原的方式,暂只支持两种方式: 0:不做插值还原。 1:最邻近插值还原。 |
1 |
[0, 16] |
参数名 |
描述 |
默认值 |
取值区间 |
---|---|---|---|
CLASS_NUM |
代表数据集类别数量(默认COCO数据集是80类)。 |
80 |
[0, 100] |
MODEL_TYPE |
代表模型类别,目前仅支持TensorFlow模型。 |
0 |
[0, 100] |
SCORE_THRESH |
代表分数阈值。 |
0.5 |
[0.0, 1.0] |