变更声明
本章节的接口变更说明包括新增、修改、删除和退出声明。接口变更只体现代码层面的修改,不包含文档本身在语言、格式、链接等方面的优化改进。
- 新增:表示此次版本新增的接口。
- 修改:表示本接口相比于上个版本有修改。
- 删除:表示该接口在此次版本已经删除。
- 退出声明:表示该接口自作出退出声明的版本起停止演进,且在后续版本退出并删除。
新增特性
类名/API原型 |
变更说明 |
---|---|
ATB使用示例 |
新增aclnn与ATB混用的demo资料。 |
atb/infer_op_params.h atb/train_op_params.h |
所有OP新增rsv预留字段,支持版本二进制兼容。 |
ActivationType |
新增支持FASTER_GELU_FORWARD激活类型。 |
AllReduceOperation |
LCCL支持多通信域并行。 |
BlockCopyOperation |
新增OP。 |
ElewiseOperation |
增加elewiseType的边界值用以修复fuzz测试时,elewiseType=0情况下出现的inner error。 |
GroupedMatmulInplaceAddOperation |
新增OP。 |
GroupedMatmulWithRoutingOperation |
新增OP。 |
GroupTopkOperation |
新增OP。 |
ReduceScatterOperation |
新增OP。 |
Linear/SelfAttention/PagedAttention/RmsNorm等OP |
新增支持 |
PagedAttentionOperation |
支持MLA INT8量化。 |
ReshapeAndCacheOperation |
支持单入单出功能。 |
SelfAttentionOperation |
新增Sliding Window Attention(SWA)。 |
SplitOperation |
split算子新增支持不等长切分。 |
修改特性
类名/API原型 |
变更说明 |
---|---|
AddOperation |
修改定义,调用失败时及时删除operation,防止内存泄漏。 |
LaserAttentionOperation |
修改scaleValue的默认值。 |
LaserAttentionGradOperation |