下载
中文
注册

工具概述

msTraceKit工具可协助开发者深入理解程序的行为,从而进行有效的性能优化。在实际应用中,开发者可以根据需要选择合适的功能,以解决具体的性能问题。

msTraceKit主要有以下功能:

  • 指令的轨迹分析:主要关注单个kernel内部的指令级行为
    • 内存分析:通过分析每条指令的内存行为,找出kernel的性能瓶颈。

工具特性

msTracekit工具的使用请参考工具使用,通过MindStudio Insight展示内存读写时序图、Cache热力图等单算子调优能力,具体请参考表1

表1 msTracekit工具功能特性

功能

链接

内存读写时序图

内存读写时序图

Cache热力图

Cache热力图

命令汇总

可以通过执行以下命令来调用msTracekit工具。

mstracekit <options> <user_program> <user_options>   
  • options为检测工具的命令行选项,详细的参数选项及其默认值,请参考表2表3,user_program为用户算子程序,user_options为用户程序的命令行选项
  • 使用msTracekit工具之前,用户需保证user_program功能正常。
表2 通用参数说明

参数名称

参数描述

参数取值

是否必选

-v,--version

查询msTracekit工具版本。

-

--type

指定轨迹分析工具类型。

  • instr:指令级轨迹分析(默认)
  • kernel:kernel级轨迹分析

--output

指定轨迹分析文件的生成路径。

{directory}:默认在当前目录下保存轨迹分析文件,若指定的目录不存在,则会自动创建。

-h,--help

输出帮助信息。

-

表3 指令级轨迹分析子参数说明

参数名称

参数描述

参数取值

是否必选

--task

--type为指令级轨迹分析时,用于指定需要启用的分析任务。

  • memtrace:内存分析。

调用场景

支持如下调用算子的场景:
  • Kernel直调:核函数运行验证的场景。

    核函数运行验证的场景,详细信息可参考核函数运行验证简介

  • 通过AscendCL单算子调用:单算子API执行的场景。

    单算子API执行的场景,详细信息可参考单算子API调用

  • 第三方框架算子调用:Pytorch框架的场景。

    通过PyTorch框架进行单算子调用的场景,详细信息可参考PyTorch框架