工具概述
msSanitizer工具是基于昇腾AI处理器的一个异常检测工具,包含了内存检测、竞争检测和未初始化检测三个子功能。用户使用msOpST工具在真实的硬件环境中对算子的功能进行测试后,可根据实际测试情况选择是否使用msSanitizer工具进行异常检测。
- 内存检测:工具可以在用户开发算子的过程中,协助定位非法读写、多核踩踏、非对齐访问、内存泄漏以及非法释放等内存问题。同时工具也支持对CANN软件栈的内存检测,帮助用户定界软件栈内存异常发生的模块。
- 竞争检测:工具可以协助用户定位由于竞争风险可能导致的数据竞争问题,包含核内竞争和核间竞争问题。其中,核内竞争包含流水间竞争和流水内竞争。
- 未初始化检测:工具可以协助用户定位由于内存未初始化可能导致的脏数据读取问题。
msSanitizer工具不支持多线程算子的检测。
工具特性
msSanitizer通过不同子功能提供了不同类型的异常检测功能,目前已支持的功能如下:
使用场景 |
使用说明 |
使用示例 |
---|---|---|
算子内存检测 |
||
算子竞争检测 |
||
算子未初始化检测 |
msSanitizer支持Ascend CL调用的Ascend C算子(包括Vector、Cube算子和Mix融合算子)未初始化的检测,可参考未初始化检测。 |
|
CANN软件栈的内存检测 |
支持CANN软件栈内存检测,详细可参考检测CANN软件栈的内存。 |
命令汇总
可以通过运行以下命令来调用msSanitizer工具。
mssanitizer <options> <user_program> <user_options>
参数名称 |
参数描述 |
参数取值 |
是否必选 |
---|---|---|---|
-v,--version |
查询msSanitizer工具版本。 |
- |
否 |
-t,--tool |
指定异常检测的子工具。 |
|
否 |
--log-file |
指定检测报告输出到文件。 |
{file_name},如配置为test_log。 说明:
|
否 |
--log-level |
指定检测报告输出等级。 |
|
否 |
--max-debuglog-size |
指定检测工具调试输出日志中单个文件大小的上限。 |
可设定范围为1~10240之间的整数,单位为mb。 默认值为1024。 说明:
--max-debuglog-size=100就表示单个调试日志的大小上限为100mb。 |
否 |
-h,--help |
输出帮助信息。 |
- |
否 |
参数名称 |
参数描述 |
参数取值 |
是否必选 |
---|---|---|---|
--check-unused-memory |
使能分配内存未使用检测。 |
|
否 |
--leak-check |
使能内存泄漏检测。 |
|
否 |
--check-device-heap |
使能device侧内存检测。 |
|
否 |
--check-cann-heap |
使能CANN软件栈内存检测。 |
|
否 |
- --check-device-heap或--check-cann-heap使能后,将不会对kernel内进行检测。
- Device侧内存检测和CANN软件栈内存检测不能同时使能,若同时使能会提示“--check-cann-heap and --check-device-heap CANNOT both enabled”。
- 使用msSanitizer工具提供的API头文件重新编译的待检测程序只能用于AsecndCL系列接口的泄漏检测,无法用于Device接口的检测。
调用场景
支持如下调用算子的场景:
- Kernel直调:核函数运行验证的场景。
核函数运行验证的场景,详细信息可参考核函数运行验证简介。具体操作请参见检测内核调用符方式的Ascend C算子。
- 通过AscendCL单算子调用:单算子API执行的场景。
单算子API执行的场景,详细信息可参考单算子API调用。具体操作请参见检测Ascend CL调用的单算子。
- 第三方框架算子调用:Pytorch框架的场景。
结果件说明
结果件名称 |
说明 |
---|---|
mssanitizer_{TIMESTAMP}_{PID}.log |
msSanitizer工具运行过程中,在当前路径下生成的工具日志,TIMESTAMP为当前时间戳,PID为当前检测工具的PID。 |
kernel.{PID}.o |
msSanitizer工具运行过程中,在当前路径下生成的算子缓存文件,PID为当前使用的检测工具的PID,该算子缓存文件用于解析异常调用栈。
|