使用前必读
功能说明
专家系统工具支持如下瓶颈识别功能,每个子功能要求的输入数据不同,功能与输入数据文件的对应关系如下:
- 算子优化分析:算子仿真文件
通过tmmodel仿真得到。参见自定义算子开发完成算子工程的创建和开发,运行算子UT测试即可,无需手动获取文件。
- 基于Timeline的AI CPU算子优化:
- om模型离线文件:om模型离线文件可通过多种方式生成,例如ATC工具转换,参见模型转换。
- Profiling Task Scheduler任务调度文件:启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
- 算子融合推荐:
- om模型离线文件:可通过多种方式生成,例如ATC工具转换,参见模型转换。
- Profiling Summary文件:使用op_Summary.csv文件和l2_cache.csv文件,启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
- 基于Roofline模型的算子瓶颈识别与优化建议:
- cce代码:可通过ATC工具添加--op_debug_level=4得到,或用户自行在算子编译时保存。参见《ATC工具使用指南》。
- Profiling Task Scheduler任务调度文件:启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
- om模型离线文件:可通过多种方式生成,例如ATC工具转换,参见模型转换。
- TransData算子识别:
- om模型离线文件:可通过多种方式生成,例如ATC工具转换,参见模型转换。
- Profiling Summary文件、Profiling基本信息文件(主要获取文件中当前芯片版本的基本信息):参见启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
输入数据文件名及保存路径请参见输入数据。
输入数据
专家系统当前功能要求准备的输入数据如表1所示,用户可以提供其中一种或多种数据的组合,每种瓶颈识别模型需要的数据及获取方式见功能说明。
输入数据 |
存储目录 |
说明 |
---|---|---|
core0_instr_popped_log.dump,算子仿真文件 core0_instr_log.dump,算子仿真文件 |
{project_location}/out/model/tm/{opname}/{casename} |
自动识别算子工程中的路径,无需手动指定。 作用于算子优化分析功能。功能配置请参见操作步骤(算子工程入口) 请确保算子仿真文件大小在100MB以内,否则无法执行专家系统分析。 |
task_time_xxxx.json,Profiling Task Scheduler任务调度文件 |
${data_path}/data/profiling/PROF_XXX |
启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。 作用于基于Timeline的AI CPU算子优化和基于Roofline模型的算子瓶颈识别与优化建议功能。功能配置请参见操作步骤(专家系统入口)。 请确保Profiling Task Scheduler任务调度文件大小在100MB以内,否则无法执行专家系统分析。 |
xxx.csv Profiling Summary文件 |
${data_path}/data/profiling/PROF_XXX |
启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。 算子融合推荐的L2融合和TransData算子识别功能需准备。功能配置请参见操作步骤(专家系统入口)。 请确保Profiling Summary文件大小在100MB以内,否则无法执行专家系统分析。 |
info.json.x Profiling基本信息文件 |
${data_path}/data/profiling/PROF_XXX |
启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。 TransData算子识别功能需准备。功能配置请参见操作步骤(专家系统入口)。 请确保Profiling基本信息文件大小在100MB以内,否则无法执行专家系统分析。 |
resnet50.om,om模型离线文件 |
${data_path}/data/project |
可在操作步骤(专家系统入口)中指定。 基于Timeline的AI CPU算子优化、算子融合推荐、基于Roofline模型的算子瓶颈识别与优化建议和TransData算子识别功能需准备。 请确保OM文件大小在1GB以内,否则无法执行专家系统分析。 |
xxx.cce,cce代码 |
${data_path}/data/project |
可在操作步骤(专家系统入口)中指定。 基于Roofline模型的算子瓶颈识别与优化建议功能需准备。 请确保CCE文件大小在100MB以内,否则无法执行专家系统分析。 |
Executable File,执行专家系统目标工程的可执行文件 |
{project_location}/out |
可在操作步骤(专家系统入口)中指定。 需要对用户应用下的模型进行精准分析,指定Inference App模式时需要准备此文件。 获取方式请参见Linux场景编译运行。 |
注:${data_path}为数据目录根路径。 |
芯片支持情况
算子优化分析:昇腾310 AI处理器、昇腾710 AI处理器。
基于Timeline的AI CPU算子优化:昇腾310 AI处理器、昇腾710 AI处理器。
算子融合推荐:昇腾310 AI处理器、昇腾710 AI处理器。
基于Roofline模型的算子瓶颈识别与优化建议:昇腾310 AI处理器、昇腾710 AI处理器。
TransData算子识别:昇腾310 AI处理器、昇腾710 AI处理器。