多节点对数据的分片方式需要与参考模型一致。
用户模型代码的多节点数据预处理流程可能存在基于文件名、文件个数等进行分片的模式。
该模式下由于文件读取接口在不同节点上对文件名排序的不同,会导致分片差异较大甚至文件重复分片到不同节点等不期望的结果。
需要增加调试代码排除类似问题,确认分片规则与基准一致。