CM_CHIEF_DEVICE
功能描述
TensorFlow分布式训练或推理场景下,用户可以选择不使用ranktable文件,通过组合使用环境变量CM_CHIEF_IP、CM_CHIEF_PORT、CM_CHIEF_DEVICE、CM_WORKER_SIZE、CM_WORKER_IP的方式自动生成资源信息,完成集合通信组件初始化。
本环境变量“CM_CHIEF_DEVICE”用于指定Master节点中统计Server端集群信息的Device逻辑ID。
该环境变量需要配置为整数,取值范围:[0,AI Server内的最大Device数量-1]。
配置示例
export CM_CHIEF_DEVICE=0
使用约束
此环境变量不能与RANK_TABLE_FILE、RANK_ID、RANK_SIZE混合使用。
支持的型号
Atlas 训练系列产品
Atlas A2 训练系列产品
父主题: TF Adapter