下载
中文
注册

struct CompileSpec

说明

用于配置compile接口所需要的参数。

定义

GraphInputs graphInputs;
PrecisionPolicy precision_policy = PrecisionPolicy::FP16;
std::string soc_version = "Ascend310xxx";
size_t minBlockSize = 1;
size_t optimizationLevel = 0;
std::vector<size_t> defaultBufferSizeVec = { 500, };
bool requireFullCompilation = false;
bool truncateLongAndDouble = true;
bool allowTensorReplaceInt = false;
std::vector<std::string> torchExecutedOps;
std::vector<std::string> torchExecutedModules;

成员

成员名称

描述

graphInputs

描述模型图中所有输入的数据结构。

默认值:无

precision_policy

设置模型的推理精度策略,支持混合精度PREF_FP32、FP16以及FP32精度。

默认值:PrecisionPolicy::FP16

soc_version

设备型号。

默认值:"Ascend310xxx"。

minBlockSize

切分子图的最少节点数量,取值范围(0,1024]。

默认值:1

optimizationLevel

模型优化等级,取值如下:

0:表示不优化;

1:表示图优化;

2:表示算子优化,仅在编译TorchScript模型时生效。

默认值:0

defaultBufferSizeVec

模型输出在编译阶段无法确定shape时的默认分配内存大小,一般用于动态模型,取值范围(0,36864],单位为MB。

支持vector的长度等于1或者输出的个数,若等于1则所有输出的默认内存大小均为该值,若等于输出个数则为每个输出单独设置默认内存大小。

默认值:{500,}

requireFullCompilation

是否要求整图编译。

默认值:false

truncateLongAndDouble

是否允许long和double类型转换。

默认值:true

allowTensorReplaceInt

是否允许采用Tensor代替Int,,仅在编译TorchScript模型时生效。

默认值:false

torchExecutedOps

强制fallback执行的算子,分图算子名格式为{"aten::add"}。

默认值:无

torchExecutedModules

强制fallback执行的模块。

默认值:无