torch_npu.contrib.module.ChannelShuffle(nn.Module):
应用NPU兼容的通道shuffle操作。为避免NPU上效率不高的连续操作,我们用相同语义重写替换原始操作。以下两个不连续操作已被替换:transpose和chunk。
Output (Tensor) - 输出张量(N, C_{out}, L_{out})。
只实现了group=2,请自行修改其他group场景。
1 2 3 4 5 | >>> from torch_npu.contrib.module import ChannelShuffle >>> x1 = torch.randn(2,32,7,7).npu() >>> x2 = torch.randn(2,32,7,7).npu() >>> m = ChannelShuffle(64, split_shuffle=True) >>> output = m(x1, x2) |