服务化调度推理

当用户已经基于ATB高性能加速库完成模型迁移后，MindIE提供了MindIE-Service组件快速帮助用户搭建推理服务化流程，同时MindIE-Service也提供了兼容第三方推理服务化接口，帮助用户快速接入第三方框架。

本章节以服务化调度推理Llama2-7B为例进行步骤说明，具体请参考《MindIE-Service开发指南》“快速开始”章节，了解MindIE-Serivce服务化调度推理。

准备数据集，获取GSM8K数据集。

参考以下脚本获得“token_gsm8k.csv”文件。

import csv
from pathlib import Path
import pyarrow.parquet as pq
import glob, os
from transformers import AutoTokenizer
def read_oa(dataset_path, tokenizer_model):
    out_list = []
    for file_path in glob.glob((Path(dataset_path) / "*.parquet").as_posix()):
        file_name = file_path.split("/")[-1].split("-")[0]
        data_dict = pq.read_table(file_path).to_pandas()
        data_dict = data_dict[data_dict['lang'] == 'zh']
        ques_list = data_dict['text'].to_list()
        for ques in ques_list:
            tokens = tokenizer_model.encode(ques)
            if len(out_list) <= 2048:
                out_list.append(tokens)
            else:
                out_list.append(tokens[0:2048])
    return out_list
def save_csv(file_path, out_tokens_list):
    with open(file_path, 'w', newline='') as csvfile:
        csv_writer = csv.writer(csvfile)
        for row in out_tokens_list:
            csv_writer.writerow(row)
if __name__ == '__main__':
    model_path = "/data/models/baichuan2-7b"
    oa_dir = "/home/xxx/oasst1"
    save_path = "oa_tokens.csv"
    tokenizer_model = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True, use_fast=True)
    tokens_lists = read_oa(oa_dir, tokenizer_model)
    save_csv(save_path, tokens_lists)

进入“mindie-service”目录，后续操作均在该路径执行（以root用户默认安装路径为例）。
```
cd /usr/local/Ascend/mindie/latest/mindie-service
```
需要根据用户实际安装路径进入mindie-service目录。
root用户：“/usr/local/Ascend/mindie/latest/mindie-service”
非root用户：“${HOME}/Ascend/mindie/latest/mindie-service”
其中${HOME}为当前用户目录。
修改“conf/config.json”文件中关键参数，具体请参见《MindIE-Service开发指南》“参数说明 > 配置参数说明”。

“conf/config.json”文件修改需要增加修改权限。

表1 本例中各修改参数详情
修改参数

参数值

httpsEnabled

false

npuDeviceIds

[[0]]

modelName

llama2_7b

modelWeightPath

llama2-7B权重实际路径

worldSize

1
执行如下命令，即可获得运行数据（其中“/path/of/token_gsm8k.csv”为1中生成）。
```
./bin/llm_engine_test /path/of/token_gsm8k.csv
```

表1 本例中各修改参数详情
修改参数	参数值
httpsEnabled	false
npuDeviceIds	[[0]]
modelName	llama2_7b
modelWeightPath	llama2-7B权重实际路径
worldSize	1