tokenids推理样例

带后处理性能测试样例

# Engine模式 tokenids推理
SMPL_PARAM='{\"temperature\":0.5,\"top_k\":10,\"top_p\":0.9,\"typical_p\":0.9,\"seed\":1234,\"repetition_penalty\":1,\"watermark\":true}'
benchmark \
--DatasetPath "/{数据集路径}/gsm8k/xx.csv" \
--DatasetType "gsm8k" \
--ModelName llama2-7b \
--ModelPath "/{模型权重路径}/LLaMA3-8B/" \
--TestType engine \
--Tokenizer False \
--Concurrency 128 \
--MaxOutputLen 512 \
--DoSampling True \
--SamplingParams=$SMPL_PARAM
图1 Engine模式tokenids推理

MindIE Benchmark的Engine推理模式输出参数说明请参见表1表2

不带后处理性能测试样例

# Engine模式 tokenids推理  
benchmark \
--DatasetPath "/{数据集路径}/gsm8k/xx.csv" \
--DatasetType "gsm8k" \
--ModelName "baichuan2_13b" \
--ModelPath "/{模型权重路径}/baichuan2-13b" \
--TestType engine \
--Tokenizer False \
--Concurrency 50