使用msprof命令行工具采集AI任务运行时性能数据,常用参数如表1所示。
参数 |
描述 |
可选/必选 |
---|---|---|
--application |
配置为运行环境上AI任务文件,不建议配置其他用户目录下的AI任务,避免提权风险。 不建议使用此参数进行有安全风险的高危操作,如删除文件或目录、修改密码、提权命令等。 说明:
|
必选 |
--output |
收集到的Profiling数据的存放路径,默认为AI任务文件所在目录。 |
可选 |
--task-time |
控制任务调度耗时以及算子耗时的开关。 涉及在ai_stack_time、task_time、op_summary、op_statistic文件中输出相关耗时数据。 可选on或off,默认为on。该参数配置前提是application参数已配置。 |
可选 |
--ai-core |
控制AI Core数据采集的开关,可选on或off,默认值为on。 |
可选 |
--aic-mode |
AI Core硬件的采集类型,可选值task-based或sample-based,默认task-based。 task-based是以task为粒度进行性能数据采集,sample-based是以固定的时间周期进行性能数据采集。 该参数配置前提是ai-core参数设置为on。 |
可选 |
--aic-metrics |
AI Core性能指标采集项,默认为PipeUtilization,包括ArithmeticUtilization、PipeUtilization、Memory、MemoryL0、MemoryUB、ResourceConflictRatio。以上各参数值对应的详细采集指标请参见AI Core性能指标采集项说明。 该参数配置前提是ai-core参数设置为on。 |
可选 |
--model-execution |
控制ge model execution性能数据采集开关,可选on或off,默认为off。该参数配置前提是application参数已配置。 该参数采集能力集成到--task-time中,若需要单独采集可关闭--task-time开关。 |
可选 |
--runtime-api |
控制runtime api性能数据采集开关,可选on或off,默认为off。该参数配置前提是application参数已配置。 可采集runtime-api性能数据,包括Host与Device之间、Device间的同步异步内存复制时延等。 |
可选 |
--aicpu |
采集AICPU算子的详细信息,如:算子执行时间、数据拷贝时间等。可选on或off,默认值为off。该参数配置前提是application参数已配置。 |
可选 |
--help |
帮助提示参数。 |
可选 |