torch_npu.optim.NpuFusedAdamP

torch_npu.optim.NpuFusedAdamP(params, lr=1e-3, betas=(0.9, 0.999), eps=1e-8, weight_decay=0, delta=0.1, wd_ratio=0.1, nesterov=False)

通过张量融合实现的AdamP算法。