下载
中文
注册

启动服务

  • MindIE Server可以部署兼容Triton/OpenAI/TGI/vLLM第三方框架接口的服务应用。推荐用户开启HTTPS通信,并按照《MindIE安装指南》中“配置MindIE > 配置MindIE Server > 单机推理”章节,配置开启HTTPS通信所需服务证书、私钥等证书文件。
  • MindIE Server启动的默认IP地址和端口号为https://127.0.0.1:1025,用户可修改config.json文件中的“ipAddress”“port”参数来配置启动IP地址与端口号。
  • MindIE Server可实现服务状态查询,模型信息查询,文本/流式推理等功能。

HTTP缺乏必要的安全机制,容易受到数据泄露、数据篡改和中间人攻击的威胁,请谨慎使用。

  1. 两种启动服务方法如下所示,以{MindIE安装目录}为例,用户可自行选择启动目录。
    • (推荐)使用后台进程方式启动服务。后台进程方式启动服务后,关闭窗口时进程也会保留。
      nohup ./bin/mindieservice_daemon > output.log 2>&1 &

      在标准输出流捕获到的文件中,打印如下信息说明启动成功。

      Daemon start success!
    • 直接启动服务。
      ./bin/mindieservice_daemon

      回显如下则说明启动成功。

      Daemon start success!
    • bin目录按照安全要求,目录权限为550,没有写权限,但执行推理过程中,算子会在当前目录生成kernel_meta 文件夹,需要写权限,因此不能直接在bin启动mindieservice_daemon。
    • Ascend-cann-toolkit工具会在执行服务启动的目录下生成kernel_meta_temp_xxxx目录,该目录为算子的cce文件保存目录。因此需要在当前用户拥有写权限目录下(例如Ascend-mindie-server_{version}_linux-{arch}目录,或者用户在Ascend-mindie-server_{version}_linux-{arch}目录下自行创建临时目录)启动推理服务。
    • 如需切换用户,请在切换用户后执行rm -f /dev/shm/*命令,删除由之前用户运行创建的共享文件。避免切换用户后,该用户没有之前用户创建的共享文件的读写权限,造成推理失败。
    • 标准输出流捕获到的文件output.log支持用户自定义文件和路径。
  2. 用户可使用HTTPS客户端(Linux curl命令,Postman工具等)发送HTTPS请求,此处以Linux curl命令为例进行说明。

    重开一个窗口,使用以下命令发送请求。例如列出当前模型列表:

    curl -H "Accept: application/json" -H "Content-type: application/json" --cacert ca.pem --cert client.pem  --key client.key.pem -X GET https://127.0.0.1:1025/v1/models
    • --cacert:验签证书文件路径。
    • ca.pem为MindIE Server服务端证书的验签证书/根证书。
    • --cert: 客户端证书文件路径。
    • client.pem为客户端证书。
    • --key:客户端私钥文件路径。
    • client.key.pem为客户端证书私钥(未加密,建议采用加密密钥)。

    请用户根据实际情况对相应参数进行修改。