--tune_ops_file
功能说明
通过配置文件指定算子名称或者算子类型,对指定的算子进行调优。支持指定的算子范围请参见算子列表。对于不在算子列表范围内的算子,不支持调优。该参数使用的场景举例如下:
在对AOE调优后生成的om模型(或者ATC转换后生成的om模型)进行Profiling性能分析后,可通过此参数指定对某个性能较低的算子进行调优。
指定的算子名称或者算子类型必须配置为经过AOE调优后生成的om模型中的OP Name/OP Type(此OP Name/OP Type可从Profiling调优数据中获取,详细可参见《性能分析工具使用指南》)。
关联参数
无。
参数取值
参数值:指定算子的配置文件路径与文件名。
参数值格式:路径和文件名:支持大小写字母(a-z,A-Z)、数字(0-9)、下划线(_)、中划线(-)、句点(.)、中文字符。
参数值约束:文件后缀不局限于.cfg格式,文件内容须为json格式的文本,文件个数只支持单个。
示例
下面以配置文件格式是cfg为例(文件名为举例为:tune_ops_file.cfg)。
{ "tune_ops_name":["bert/embeddings/addbert/embeddings/add_1","loss/MatMul"], "tune_ops_type":["Add", "Mul"] }
- tune_ops_name:指定的算子名称,当前实现是支持全字匹配,可以指定一个,也可以指定多个,指定多个时需要用英文逗号分隔。
- tune_ops_type:指定的算子类型,当前实现是支持全字匹配,可以指定一个,也可以指定多个,指定多个时需要用英文逗号分隔。如果有融合算子包括了该算子类型,则该融合算子也会被调优。
- 如上配置文件的内容必须放在"{}"中,tune_ops_type和tune_ops_name的配置内容必须放在"[]"中。
- tune_ops_type和tune_ops_name可以同时存在,同时存在时取并集,也可以只存在某一个。
将配置好的tune_ops_file.cfg文件上传到调优引擎所在服务器任意目录,例如上传到/home/Davinci/,使用示例如下:
--tune_ops_file=/home/Davinci/tune_ops_file.cfg
父主题: 高级功能