--input_shape
功能说明
指定模型输入数据的shape。
关联参数
设置shape分档场景,需要配合使用--dynamic_batch_size(设置BatchSize档位)或--dynamic_image_size(设置分辨率档位)或--dynamic_dims(设置指定维度档位)参数。
参数取值
参数值:
- 固定shape:
- 若模型为单个输入,则shape信息为"input_name:n,c,h,w";指定的节点必须放在双引号中。
- 若模型有多个输入,则shape信息--input_shape="input_name1:n1,c1,h1,w1;input_name2:n2,c2,h2,w2";不同输入之间使用英文分号分隔,input_name必须是转换前的网络模型中的节点名称。
- 若原始模型中输入数据的某个或某些维度值不固定,当前支持通过设置shape分档或设置shape范围两种方式转换模型:
- 设置shape分档,包括设置BatchSize档位、设置分辨率档位、设置指定维度档位(最多4维)。
设置--input_shape参数时,将对应维度值设置为-1,同时配合使用--dynamic_batch_size(设置BatchSize档位)或--dynamic_image_size(设置分辨率档位)或--dynamic_dims(设置指定维度档位)参数。
- 设置shape范围。Atlas 200/300/500 推理产品、Atlas 200I/500 A2推理产品不支持设置shape范围。
设置--input_shape参数时,可将对应维度的值设置为范围,例如1~10。
如果用户不想指定维度的的范围或具体取值,则可以将其设置为-1,模型转换时该维度被解析为>=0的任意取值。
- 设置shape分档,包括设置BatchSize档位、设置分辨率档位、设置指定维度档位(最多4维)。
参数值约束:
- 如果模型输入数据为标量(例如BOOL类型),该场景下无需配置对应节点的--input_shape参数。
- 若原始模型中输入数据的某个维度值不固定(例如input_name1:?,h,w,c),通过Netron等可视化软件打开模型之后,输入信息样例如下:
该场景下可以进行如下操作:
- 固定shape,将维度值设置为固定取值,例如,input_name1:1,h,w,c,用于将输入数据某个维度不固定的原始模型转换为固定维度的离线模型。
- 设置shape分档,例如设置为“-1”,与--dynamic_batch_size参数配合使用。
- 设置shape范围时,若设置为-1,表示此维度可以使用>=0的任意取值,该场景下取值上限为int64数据类型表达范围,但受限于host和device侧物理内存的大小,用户可以通过增大内存来支持。
- 若使用该参数时,同时通过--insert_op_conf设置了AIPP功能,则AIPP输出图片的宽和高要在本参数所设置的范围内。
推荐配置及收益
无。
示例
- 固定shape,例如某网络的输入shape信息,输入1:input_0_0 [16,32,208,208],输入2:input_1_0 [16,64,208,208],则--input_shape的配置信息为:
--input_shape="input_0_0:16,32,208,208;input_1_0:16,64,208,208"
- 设置BatchSize档位的示例,请参见--dynamic_batch_size。
- 设置分辨率档位的示例,请参见--dynamic_image_size。
- 设置指定维度档位的示例,请参见--dynamic_dims。
- 设置shape范围的示例:
--input_shape="input_0_0:1~10,32,208,208;input_1_0:16,64,100~208,100~208"
支持的型号
Atlas 200/300/500 推理产品
Atlas 推理系列产品
Atlas 训练系列产品
Atlas 200I/500 A2推理产品
Atlas A2训练系列产品/Atlas 800I A2推理产品
依赖约束
- 使用约束:
如果用户通过--input_shape设置了动态shape范围参数,同时又通过--insert_op_conf参数配置了AIPP功能,则AIPP输出的宽和高要在--input_shape所设置的范围内。
- 接口约束:
如果模型转换时通过该参数设置了shape的范围,使用应用工程进行模型推理时,需在aclmdlExecute接口之前,调用aclmdlSetDatasetTensorDesc接口,用于设置真实的输入Tensor描述信息(输入shape范围);模型执行之后,调用aclmdlGetDatasetTensorDesc接口获取模型动态输出的Tensor描述信息;再进一步调用aclTensorDesc下的操作接口获取输出Tensor数据占用的内存大小、Tensor的Format信息、Tensor的维度信息等。