下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

--op_tune_mode

功能说明

有些大模型场景,部分二进制kernel替换成静态kernel后,性能更优。基于该背景,AOE新增了该参数支持静态kernel调优功能,根据输入的算子信息json文件,生成调优后的kernel,并保存到指定目录。

当前该功能仅支持Atlas A2训练系列产品

关联参数

该参数取值为static_kernel或者fast时,需要和--op_tune_file--precision_mode=must_keep_origin_dtype同时使用。

参数取值

取值如下。

  • static_kernel:静态kernel调优模式。该模式下,使用静态kernel进行编译,并生成调优后的kernel,保存到指定路径。
  • fast:仅编译模式。该模式下,生成编译后的kernel,保存到指定路径。

示例

--op_tune_file=/home/lxl/json --op_tune_mode=static_kernel --precision_mode=must_keep_origin_dtype --op_tune_kernel_path=/home/lxl/kernel
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词