下载
中文
注册

使用kubectl部署服务示例

  • 该示例支持部署单机版的mindie_server、ms_coordiantor、ms_controller。
  • Atlas 800I A2 推理产品需要配置卡IP并安装MindCluster中的HCCL-Controller组件;Atlas 300I Duo 推理卡+Atlas 800 推理服务器(型号:3000)无需配置和安装。
  • 当前部署脚本不支持NPU故障重调度场景。

本小节使用mindie-service run包安装目录下(./mindie-service/latest/examples/kubernetes_deploy_scripts)中的脚本实现调用kubectl进行服务部署,脚本提供一键式部署和卸载单机形态集群功能,集群管理员用户可参考这些脚本线下使用K8s kubectl工具部署服务。

集群管理员用户只需在管理节点完成启动脚本编写、业务配置和K8s配置,再调用部署脚本,实现自动下发业务配置和启动脚本,自动生成包含节点设备信息的ranktable,并调度Pod到计算节点。

脚本文件所在目录结构如下所示:

├── boot_helper
│   ├── boot.sh
│   ├── get_group_id.py
│   └── update_mindie_server_config.py
├── chat.sh
├── conf
├── delete.sh
├── deployment
│   ├── mindie_ms_controller.yaml
│   ├── mindie_ms_coordinator.yaml
│   ├── mindie_server_heterogeneous.yaml
│   └── mindie_server.yaml
├── deploy.sh
├── generate_stream.sh
├── gen_ranktable_helper
│   ├── gen_global_ranktable.py
│   └── global_ranktable.json
└── log.sh

关键目录及文件解释如下所示:

  • conf:MindIE MS和MindIE Server的主要业务配置文件,PD分离管理调度策略和模型相关配置。
  • boot_helper:包含容器启动脚本boot.sh,获取group_id,刷新环境变量到配置文件,设置启动程序的环境变量等,用户可根据需要在这里调整日志等级等,环境变量详细介绍请参见表1
  • deployment: K8s部署任务定义,配置NPU资源使用量,实例数,镜像等。
  • gen_ranktable_helper:生成global ranktable的工具,用户无需感知。
  • chat.sh:使用curl发送HTTPS请求给推理服务的简单对话示例。
  • generate_stream.sh:使用curl发送HTTPS请求给推理服务的流式响应示例。
  • deploy.sh:部署入口脚本,一键拉起所有MindIE组件。
  • delete.sh:卸载脚本,一键卸载所有MindIE组件。
  • log.sh:查询Pod的打屏日志,可查询到部署的所有Pod的日志。

部署样例如下所示,以下操作均在部署脚本路径下完成:

  1. 创建mindie命名空间。
    kubectl create namespace mindie
  2. 将mindie-service发布件中conf目录的config.json、http_client_ctl.json、ms_controller.json和ms_coordinator.json文件拷贝至脚本conf目录(./mindie-service/latest/examples/kubernetes_deploy_scripts/conf)。
  3. 配置MindIE MS的Controller和Coordinator组件,将这两个组件的部署模式配置为单机(非分布式)服务部署模式,其必配参数如下所示。
    • 配置ms_controller.json文件,参数详请请参见配置说明章节。
      将部署模式配置为单机(非分布式)服务部署模式,需配置以下参数。
      "deploy_mode"= "single_node"
    • 配置ms_coordinator.json文件,参数详请请参见配置说明章节。
      • 配置单机(非分布式)服务部署模式,需配置以下参数。
        "deploy_mode"= "single_node"
      • 使能Prefix Cache特性,需配置以下参数。(Prefix Cache特性目前只支持单机部署场景)
        "scheduler_type": "default_scheduler",
        "algorithm_type": "cache_affinity",
  4. 配置MindIE Server服务启动的config.json配置文件,单机(非分布式)服务部署模式需要配置以下参数,具体参数解释请参见配置参数说明
    • modelWeightPath:模型权重文件目录配置,默认情况下脚本会挂载物理机的/data目录,该参数需配置为/data路径下的模型权重路径,确保集群可调度计算节点在该路径下存在模型文件。
    • worldSize:配置一个实例需要占用的卡数;例如配置为“2”,表示使用两张卡。
    • npuDeviceIds:卡号配置成从0开始编号,总数与worldSize一致,如配置为[[0,1]]。
    • 使能Prefix Cache场景:
      • 在ModelDeployConfig中的ModelConfig下添加以下信息:
        "plugin_params": "{\"plugin_type\":\"prefix_cache\"}"
      • 在ScheduleConfig中添加以下信息:
        "enablePrefixCache": true
  5. 配置启动脚本boot.sh。

    MindIE Server环境变量配置单机部署模式:

    export PD_MODE=3
  6. 配置kubernetes Deployment。

    在部署脚本目录中的deployment目录下找到mindie_server.yaml、mindie_ms_coordinator.yaml和mindie_ms_controller.yaml文件。

    用户在使用kubetl部署Deployment时,需要修改脚本目录deployment中的.yaml配置文件,请避免使用危险配置,确保使用安全镜像(非root权限用户),配置Pod安全上下文,挂载安全路径(非软链接、系统危险路径或业务敏感路径)并设置了安全的文件目录权限。本脚本仅作为一个部署参考,Pod容器的安全性由用户自行保证,实际生产环境请针对镜像和Pod安全进行加固。

    • mindie_server.yaml文件主要配置的字段如下所示:
      • replicas:配置总实例数。
      • huawei.com/Ascend910(或310P):resources资源请求,配置一个实例占用的NPU卡数,与MindIE Serve的config.json配置文件中worldSize参数配置的卡数保持一致。
      • image:配置镜像名。
      • nodeSelector:节点选择,用户期望调度的节点,通过节点标签实现。
      • ring-controller.atlas:根据实际使用的设备型号配置为ascend-910b或ascend-310p。
      • livenessProbe:存活探针,当服务启动时间较长,需要延迟存活检测开始时间,需配置“initialDelaySeconds”参数为合理值。
    • mindie_ms_coordinator.yaml和mindie_ms_controller.yaml文件主要配置的字段如下所示:
      • image:配置镜像名。
      • nodeSelector:节点选择,用户期望调度的节点,通过节点标签实现。

      另外,mindie_ms_coordinator.yaml文件还需特别关注livenessProbe(存活探针)参数,在高并发推理请求场景下,可能会因为探针超时,从而被K8s识别为Pod不存活,导致K8s重启Coordinator容器,建议用户谨慎开启livenessProbe(存活探针)。

  7. 拉起集群。

    首先配置容器内mindie安装的目录:根据制作镜像时实际的安装路径,修改MINDIE_USER_HOME_PATH的value值,如安装路径是/xxx/Ascend/mindie, 则配置为/xxx 。

    export MINDIE_USER_HOME_PATH={镜像的安装路径}
    使用以下命令拉起集群。
    bash deploy.sh

    执行后,会同步等待global ranktable生成完成,如长时间处于阻塞状态,请ctrl+c中断后查看集群Pod状态,进行下一步的调试定位。

    • 集群默认刷新挂载到容器内的configmap的频率是60s,如遇到容器内打印“status of ranktable is not completed”日志信息的时间偏久,可在每个待调度的计算节点修改kubelet同步configmap的周期,即修改/var/lib/kubelet/config.yaml中的syncFrequency参数,将周期减少到5s,注意此修改可能影响集群性能。
      syncFrequency: 5s

      然后使用以下命令重启kubelet:

      swapoff -a
      systemctl restart  kubelet.service
      systemctl status kubelet
    • 确保Docker配置了标准输出流写入到文件的最大规格,防止磁盘占满导致Pod被驱逐。

      需在待部署服务的计算节点上修改Docker配置文件后重启Docker:

      1. 使用以下命令打开daemon.json文件。
        vim /etc/docker/daemon.json
        在daemon.json文件中添加日志选项“log-opts”,具体内容如下所示。
        "log-opts":{"max-size":"500m", "max-file":"3"}

        参数解释:

        max-size=500m:表示一个容器日志大小上限是500M。

        max-file=3:表示一个容器最多有三个日志,超过会自动滚动更新。

      2. 使用以下命令重启Docker.
        systemctl daemon-reload
        systemctl restart docker
  8. 查看集群状态。

    通过kubectl命令查看Pod状态:

    kubectl get pods -n mindie

    如启动4个MindIE Server 实例,回显如下所示:

    NAME                                     READY   STATUS    RESTARTS   AGE    IP               NODE       NOMINATED NODE   READINESS GATES
    mindie-ms-controller-7845dcd697-h4gw7    1/1     Running   0          145m   xxx.xxx.xxx    ubuntu10   <none>           <none>
    mindie-ms-coordinator-6bff995ff8-l6fwz   1/1     Running   0          145m   xxx.xxx.xxx    ubuntu10   <none>           <none>
    mindie-server-7b795f8df9-2xvh4           1/1     Running   0          145m   xxx.xxx.xxx   ubuntu     <none>           <none>
    mindie-server-7b795f8df9-j4z7d           1/1     Running   0          145m   xxx.xxx.xxx   ubuntu     <none>           <none>
    mindie-server-7b795f8df9-v2tcz           1/1     Running   0          145m   xxx.xxx.xxx   ubuntu     <none>           <none>
    mindie-server-7b795f8df9-vl9hv           1/1     Running   0          145m   xxx.xxx.xxx   ubuntu     <none>           <none>
    • 以mindie-ms-controller开头的为MindIE MS的Controller控制器组件。
    • 以mindie-ms-coordinator开头的为MindIE MS的Coordinator调度器组件。
    • 以mindie-server开头的为MindIE Server推理服务。

    如观察Pod进入Running状态,表示pod容器已成功被调度到节点并正常启动,但还需要进一步确认业务程序是否启动成功。

    通过脚本示例提供的log.sh脚本可查询这些Pod的标准输出日志,查看是否出现异常:

    bash log.sh
    • 如需要查询具体某个Pod(如上面mindie-server-7b795f8df9-2xvh4)的日志,则执行以下命令:
      kubectl logs mindie-server-7b795f8df9-2xvh4 -n mindie
    • 如需要进入容器查找更多定位信息,则执行以下命令:
      kubectl exec -it mindie-server-7b795f8df9-2xvh4 -n mindie -- bash
  9. 通过脚本示例提供的chat.sh发起推理请求。

    需修改chat.sh中的IP地址为当前节点的IP地址,其中role配置为user。

    bash chat.sh
  10. 卸载集群。
    如需停止单机服务或者修改业务配置重新部署实例,需要调用以下命令卸载已部署的实例,重新部署请执行7
    bash delete.sh