下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

使用前必读

前提条件

参见CANN 软件安装指南安装Ascend-cann-toolkit开发套件包。

功能说明

专家系统工具支持如下瓶颈识别功能,每个子功能要求的输入数据不同,功能与输入数据文件的对应关系如下:

  • 算子优化分析:算子仿真文件

    通过tmmodel仿真得到。参见自定义算子开发完成算子工程的创建和开发,运行算子UT测试即可,无需手动获取文件。

  • 基于Timeline的AI CPU算子优化
    • om模型离线文件:om模型离线文件可通过多种方式生成,例如ATC工具转换,参见模型转换
    • Profiling Task Scheduler任务调度文件:启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
  • 算子融合推荐
    • om模型离线文件:可通过多种方式生成,例如ATC工具转换,参见模型转换
    • Profiling Summary文件:使用op_Summary.csv文件和l2_cache.csv文件,启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
  • 基于Roofline模型的算子瓶颈识别与优化建议
    • cce代码:可通过ATC工具添加--op_debug_level=4得到,或用户自行在算子编译时保存。参见ATC工具使用指南
    • Profiling Task Scheduler任务调度文件:启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
    • om模型离线文件:可通过多种方式生成,例如ATC工具转换,参见模型转换
  • TransData算子识别
    • om模型离线文件:可通过多种方式生成,例如ATC工具转换,参见模型转换
    • Profiling Summary文件、Profiling基本信息文件(主要获取文件中当前芯片版本的基本信息):参见启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。

输入数据文件名及保存路径请参见输入数据

输入数据

专家系统当前功能要求准备的输入数据如表1所示,用户可以提供其中一种或多种数据的组合,每种瓶颈识别模型需要的数据及获取方式见功能说明

表1 专家系统输入数据

输入数据

存储目录

说明

core0_instr_popped_log.dump,算子仿真文件

core0_instr_log.dump,算子仿真文件

{project_location}/out/model/tm/{opname}/{casename}

自动识别算子工程中的路径,无需手动指定。

作用于算子优化分析功能。功能配置请参见操作步骤(算子工程入口)

请确保算子仿真文件大小在100MB以内,否则无法执行专家系统分析。

task_time_xxxx.json,Profiling Task Scheduler任务调度文件

${data_path}/data/profiling/PROF_XXX

启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。

作用于基于Timeline的AI CPU算子优化基于Roofline模型的算子瓶颈识别与优化建议功能。功能配置请参见操作步骤(专家系统入口)

请确保Profiling Task Scheduler任务调度文件大小在100MB以内,否则无法执行专家系统分析。

xxx.csv

Profiling Summary文件

${data_path}/data/profiling/PROF_XXX

启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。

算子融合推荐L2融合TransData算子识别功能需准备。功能配置请参见操作步骤(专家系统入口)

请确保Profiling Summary文件大小在100MB以内,否则无法执行专家系统分析。

info.json.x

Profiling基本信息文件

${data_path}/data/profiling/PROF_XXX

启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。

TransData算子识别功能需准备。功能配置请参见操作步骤(专家系统入口)

请确保Profiling基本信息文件大小在100MB以内,否则无法执行专家系统分析。

resnet50.om,om模型离线文件

${data_path}/data/project

可在操作步骤(专家系统入口)中指定。

基于Timeline的AI CPU算子优化算子融合推荐基于Roofline模型的算子瓶颈识别与优化建议TransData算子识别功能需准备。

请确保OM文件大小在1GB以内,否则无法执行专家系统分析。

xxx.cce,cce代码

${data_path}/data/project

可在操作步骤(专家系统入口)中指定。

基于Roofline模型的算子瓶颈识别与优化建议功能需准备。

请确保CCE文件大小在100MB以内,否则无法执行专家系统分析。

Executable File,执行专家系统目标工程的可执行文件

{project_location}/out

可在操作步骤(专家系统入口)中指定。

需要对用户应用下的模型进行精准分析,指定Inference App模式时需要准备此文件。

获取方式请参见Linux场景编译运行

注:${data_path}为数据目录根路径。

芯片支持情况

算子优化分析:昇腾310 AI处理器昇腾710 AI处理器

基于Timeline的AI CPU算子优化:昇腾310 AI处理器昇腾710 AI处理器

算子融合推荐:昇腾310 AI处理器昇腾710 AI处理器

基于Roofline模型的算子瓶颈识别与优化建议:昇腾310 AI处理器昇腾710 AI处理器

TransData算子识别:昇腾310 AI处理器昇腾710 AI处理器

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词