torch_npu.contrib.npu_fused_attention

API接口

torch_npu.contrib.npu_fused_attention(hidden_states, attention_mask, query_kernel, key_kernel, value_kernel, query_bias, key_bias, value_bias, scale=1, keep_prob=0)

功能描述

bert自我注意的融合实现。

参数说明

输出说明

torch.Tensor:The result of self attention