MindIE支持模型列表
MindIE支持的模型列表如表1所示。
模型名称 |
多卡能力 |
数据类型 |
量化 |
服务化 |
长序列 |
非首token的推理方式 FA(Flash Attention) PA(Paged Attention) |
---|---|---|---|---|---|---|
Baichuan-7B |
|
|
不支持 |
|
不支持 |
|
Baichuan-13B |
|
|
不支持 |
|
不支持 |
|
Baichuan2-7B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
Baichuan2-13B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
Bloom-176B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
Bloom-7B |
|
|
不支持 |
|
不支持 |
|
Bloomz-7B |
|
|
不支持 |
|
不支持 |
|
ChatGLM2-6B |
|
|
|
|
不支持 |
|
ChatGLM3-6B-32K |
|
|
不支持 |
|
不支持 |
|
CodeGeeX2-6B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
CodeLLaMA-13B |
|
|
不支持 |
|
不支持 |
|
CodeLLaMA-34B |
|
|
|
|
不支持 |
|
CodeLLaMA-70B |
|
|
不支持 |
|
不支持 |
|
CodeShell-7B |
|
|
不支持 |
|
不支持 |
|
DeepSeek-Coder-6.7B |
|
|
不支持 |
|
不支持 |
|
DeepSeek-Coder-7B |
|
|
不支持 |
|
不支持 |
|
DeepSeek-Coder-33B |
|
|
不支持 |
|
不支持 |
|
DeepSeek-MoE-16B |
|
|
不支持 |
|
不支持 |
|
Gemma-7B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
InterLM-20B |
|
|
不支持 |
|
不支持 |
|
InternLM2-20B |
|
|
不支持 |
|
支持 |
|
LLaMa2-7B |
|
|
|
|
不支持 |
|
LLaMa2-13B |
|
|
|
|
不支持 |
|
LLaMa2-70B |
|
|
|
|
不支持 |
|
LLaMA-33B |
|
|
稀疏量化:仅Atlas 300I Duo 推理卡支持 |
|
不支持 |
|
LLaMA3-8B |
|
|
不支持 |
|
不支持 |
|
LLaMA3-70B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
|
支持 |
|
LLaMA-65B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
Mistral-7B |
|
|
不支持 |
|
不支持 |
|
Mixtral-8x7B |
|
|
不支持 |
|
不支持 |
|
Qwen-7B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
Qwen-14B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
Qwen-72B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
Qwen1.5-7B |
|
|
不支持 |
|
支持 |
|
Qwen1.5-14B |
|
|
|
|
支持 |
|
Qwen1.5-32B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
Qwen1.5-72B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
Starcoder-15.5B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
StarCoder2-15B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
|
Vicuna-7B |
|
|
不支持 |
|
不支持 |
|
Vicuna-13B |
|
|
不支持 |
|
不支持 |
|
Yi-6B-200K |
|
|
不支持 |
|
不支持 |
|
Yi-34B-200K |
|
|
不支持 |
|
支持 |
|
ziya-coding-34B |
|
|
不支持 |
|
不支持 |
|