可维可测能力
ATB当前提供以下可维可测能力:
其中,除日志系统外,其他所有可维可测能力都集成在msit工具内,需要通过工具进行使用。工具使用说明见msit工具使用指导。
日志系统
ATB的日志系统支持日志分级、日志输出到标准输出、日志输出到文件。
- 日志分级
其中,前四个级别的日志主要是面向用户的;DEBUG级别与TRACE级别则主要是面向ATB开发者的。
- 日志保存
- 日志文件保存在“[LOG_PATH]/[TYPE]/log”下。其中,[LOG_PATH]由环境变量(请参见环境变量参考)ASDOPS_LOG_PATH控制,默认为"~";[TYPE]由环境变量(请参见环境变量参考)“ASDOPS_LOG_TO_BOOST_TYPE”控制,默认为“atb”。例如:“~/atb/log”。
- 日志文件的命名格式为[TYPE]_[PID]_[年][月][日][时][分][秒].log,其中,[TYPE]为环境变量(请参见环境变量参考)“ASDOPS_LOG_TO_BOOST_TYPE”控制,默认为“atb”,[PID]为线程号。例如:atb_253440_20231102065052.log。
- 空间管理
- 每个日志文件大小最大为1GByte,最多存50个文件。如当前保存目录下的日志文件(以标准命名格式存储的日志文件)达到最高存储数量,将根据时间戳,删除最早时间的日志文件。
- 在生成日志文件前,将会对日志保存目录的空间大小进行判断,如果空间不足10GByte,将不会继续生成日志文件。
DumpTensor能力
该功能通过msit工具使能,主要用在精度调试场景,可通过配置参数来指定dump特定或全部Operation的Tensor二进制文件。详细信息请参考DumpTensor能力使用指导。
保存Operation信息与保存Kernel信息
这两个功能通过msit工具使能,可将运行过程中的Operation信息或Kernel信息(如参数、输入张量Shape、输出张量Shape等)保存成csv文件。详细信息请参考保存算子信息能力使用指导。
保存CPU Profiling数据
该功能通过msit工具使能,将ATB各个host侧接口的性能信息保存到文本文件中,用于host bound的性能问题定位。详细信息请参考保存CPU Profiling数据功能使用指导。