CLUSTER_CONFIG配置文件参数说明
参数 |
类型 |
是否必填 |
描述 |
|||
---|---|---|---|---|---|---|
cluster |
- |
集群配置。 |
||||
cluster_nodes |
- |
Array of Cluster_node |
是 |
集群资源信息描述。 |
||
node_id |
- |
Integer |
是 |
集群内节点编号,一般0作为主节点。 |
||
node_type |
- |
String |
是 |
节点类型,如ATLAS800。 |
||
ipaddr |
- |
String |
是 |
节点控制面通信的IP,如训练服务器为HOST IP、SOC服务器为头节点IP。 |
||
port |
- |
Integer |
是 |
节点控制面通信的端口。 |
||
is_local |
- |
BOOL |
否 |
多个Node组成集群时,此文件此节点是否是本机。 |
||
item_list |
- |
Array of item_info |
是 |
云资源管理编排的执行该JOB的加速卡。 |
||
- |
item_id |
Integer |
是 |
Node内加速卡id。 |
||
item_def |
- |
Node内同种类型的加速卡的公共属性。 |
||||
device_list |
- |
Array of device_info |
否 |
整芯片内包含几个物理device。Atlas 训练系列产品不需要填写该配置项。 |
||
device_id |
- |
Integer |
是 |
整芯片内物理device id。 |
||
item_type |
- |
- |
String |
是 |
节点内加速卡类型。 |
|
node_def |
- |
集群内同种类型Node的公共属性。 |
||||
item |
item_type |
- |
String |
是 |
节点内加速卡类型。 |
父主题: 附录