开启锁页内存以去除NPU与CPU间的数据交互,将数据直接放在锁页内存中提升数据传输效率。
样例脚本优化前如下。
dataloader = torch.utils.data.Dataloader(dataset, batch_size, shuffle, num_workers)
优化后,开启non_blocking=True。
dataloader = torch.utils.data.Dataloader(dataset, batch_size, shuffle, num_workers, non_blocking=True)