下载
中文
注册

查看调优结果

执行调优结果如下所示,代表调优完成。调优后的自定义知识库请参见自定义知识库,调优结果文件请参见算子调优结果文件

1
2
[Aoe]<xxxx> Tuning process finished.     //xxxx:算子名称。
[Aoe]Aoe process finished,cost time 1109s.              //调优完成。

自定义知识库

调优完成后,若满足自定义知识库生成条件(请参见图3),则会生成自定义知识库。自定义知识库存放路径的优先级为:TUNE_BANK_PATH>ASCEND_CACHE_PATH>默认,TUNE_BANK_PATH和ASCEND_CACHE_PATH详细信息请参考环境变量参考

若未配置TUNE_BANK_PATH和ASCEND_CACHE_PATH(可以使用env命令查询是否配置),自定义知识库默认存储在:${HOME}/Ascend/latest/data/aoe/custom/op/${soc_version}。

如何使用调优后的自定义知识库请参见如何使用调优后的自定义知识库

算子调优结果文件

算子调优结果文件的存放路径优先级为:ASCEND_WORK_PATH > 默认(执行调优的工作目录),若未配置ASCEND_WORK_PATH(可以使用env命令查询是否配置,ASCEND_WORK_PATH详细信息请参考环境变量参考),算子调优结果文件存放在默认路径(执行调优的工作目录)。

调优过程中,实时生成的结果文件命名为“aoe_result_opat_${timestamp}_${pidxxx}.json”,记录了调优过程中被调优的算子信息。其中${timestamp}为时间戳,格式为:年月日时分秒毫秒,“${pidxxx}”中的“xxx”为进程ID。

内容格式如下所示,可以包括多个调优任务,各字段含义请参见表1tid表示线程ID。

{
   "report_${timestamp}_${tid}": [
    {
      "basic": {
        "tuning_name": "调优任务名",
        "tuning_time(s)": 26
      }
    },
    {
      "OPAT": {
        "opat_tuning_result": "tuning successful",
      "repo_modified_operators": [
        {
          "op_name": "softmax",
          "op_type": "SoftmaxV2",
          "tune_performance": {
            "Format": {
              "performance_after_tune(us)": 99,
              "performance_before_tune(us)": 134,
              "performance_improvement": "35.35%",
              "update_mode": "add"
            }
          }
        },
       .......
        {
          "op_name": "Conv_125",
          "op_type": "Conv2D",
          "tune_performance": {
            "Schedule": {
              "performance_after_tune(us)": 72.046,
              "performance_before_tune(us)": 72.055,
              "performance_improvement": "0.01%",
              "update_mode": "add"
            }
          }
        }
      ],
      "repo_summary": {
        "repo_add_num": 19,
        "repo_hit_num": 0,
        "repo_reserved_num": 0,
        "repo_unsatisfied_num": 2,
        "repo_update_num": 0,
        "total_num": 21
      }
    }
  }
],
  "report_${timestamp}_${tid}": [
   ........
   .....

调优失败时(即opat_tuning_result显示为"tuning failed"时),还会显示调优失败的算子的op_name列表。

      "tuning_failed_operators": [
        "res4a_branch1"
       ]
表1 字段含义

字段名称

含义

basic

-

tuning_name

-

-

调优任务名称。

-

tuning_time(s)

-

-

调优耗费的时长,单位:s。

调优中断场景下(比如coredump、oom)不记录该字段。

OPAT

说明:

没有可调优的算子时,该段信息不存在。

-

opat_tuning_result

-

-

调优结果,成功时显示为"tuning successful",失败时显示为"tuning failed",调优未完成、异常中断退出时显示为"tuning incomplete"。

-

repo_modified_operators

-

-

调优后,调优策略有增加和更新的算子详细信息。

-

-

op_name

-

算子名称。

-

-

op_type

-

算子类型。可以有一个,也可以有多个。当有多个的时候,需要使用[]将多个算子类型括起来。

-

-

tune_performance

-

算子性能提升具体信息。

-

-

Format或者Schedule或者Impl

-

算子的调优模式,包括如下取值:

  • Format:当算子调优过程中使能了Format调优功能,且有Format调优的性能提升时,会出现该字段。
  • Schedule:当算子调优过程中有Schedule调优的性能提升时,会出现该字段。
  • Impl:当算子调优过程中有Impl调优的性能提升时,会出现该字段。

-

-

-

performance_after_tune(us)

调优后算子执行时间,单位:us。

-

-

-

performance_before_tune(us)

调优前算子执行时间,单位:us。

-

-

-

performance_improvement

调优后算子执行时间减少百分比。

-

-

-

update_mode

算子调优策略更新模式,取值如下。

  • add:增加算子调优策略。
  • update:更新算子调优策略。
说明:

针对每个调优策略有新增或者更新的算子,都会包括如上op_name~update_mode的信息。

-

repo_summary

-

-

记录调优任务中不同状态算子的信息。

-

-

repo_add_num

-

调优前调优策略不在知识库中,调优后调优策略追加到知识库中的调优策略个数。

-

-

repo_hit_num

-

调优过程中调优策略在知识库中的调优策略个数。

-

-

repo_reserved_num

-

调优前调优策略在知识库中,调优后知识库中的调优策略无变化的调优策略个数。

-

-

repo_unsatisfied_num

-

调优前调优策略不在知识库,调优后也未写入知识库的调优策略个数。

-

-

repo_update_num

-

调优前调优策略在知识库中,调优后知识库中的调优策略有更新的调优策略个数。

-

-

total_num

-

调优任务中被调优的调优策略总数。

  • repo_hit_num=repo_update_num+repo_reserved_num
  • total_num=repo_add_num+repo_hit_num+repo_unsatisfied_num

-

tuning_failed_operators

-

-

调优失败的算子的op_name列表。

说明:

可选,当opat_tuning_result显示"tuning failed"时才记录该字段。