Volcano配置
“volcano-*.yaml”中可配置优雅删除原Pod的时间,请根据实际情况合理配置该值。若使用断点续训中的临终遗言功能,会使用该项配置。该配置全局生效,会影响当前环境中的训练任务,建议在安装Volcano的时候配置,在系统运行过程中不建议修改。参数默认值及示例如下。
名称 |
默认值 |
范围 |
含义 |
---|---|---|---|
grace-over-time |
900,单位:秒 |
[2, 3600] |
表示从触发Pod删除,到Pod被强制删除的这段时间间隔。超过这个时间之后会强制删除原pod。 |
“volcano-*.yaml”示例
... apiVersion: v1 kind: ConfigMap metadata: name: volcano-scheduler-configmap namespace: volcano-system data: volcano-scheduler.conf: | actions: "enqueue, allocate, backfill" tiers: - plugins: - name: priority - name: gang - name: conformance - name: volcano-npu-v3.0.RC3 - plugins: - name: drf - name: predicates - name: proportion - name: nodeorder - name: binpack configurations: ... - name: init-params arguments: {"grace-over-time":"900","presetVirtualDevice":"true"} ...
父主题: MindX DL组件配置