大语言模型列表
MindIE支持的大语言模型列表如表1所示。
模型名称 |
多卡能力 |
数据类型 |
量化 |
服务化 |
长序列 |
---|---|---|---|---|---|
Baichuan2-7B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
Baichuan2-13B |
|
|
|
|
不支持 |
Bloom-7B |
|
|
不支持 |
|
不支持 |
Bloom-176B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
不支持 |
不支持 |
Bloomz-7B1-mt-7B |
|
|
不支持 |
不支持 |
不支持 |
ChatGLM2-6B |
|
|
|
|
不支持 |
ChatGLMV3-32K-6B |
|
|
不支持 |
|
不支持 |
CodeGeeX2-6B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
CodeLLaMA-13B |
|
|
不支持 |
|
不支持 |
CodeLLaMA-34B |
|
|
|
|
不支持 |
CodeLLaMA-70B |
|
|
不支持 |
不支持 |
不支持 |
CodeShell-7B |
|
|
不支持 |
不支持 |
不支持 |
DeepSeek-Coder-6.7B |
|
|
不支持 |
不支持 |
不支持 |
DeepSeek-Coder-7B |
|
|
不支持 |
不支持 |
不支持 |
DeepSeek-Coder-33B |
|
|
不支持 |
不支持 |
不支持 |
DeepSeek-MoE-16B |
|
|
不支持 |
|
不支持 |
DeepSeek-V2-Lite-16B |
|
|
不支持 |
不支持 |
不支持 |
DeepSeek-V2-236B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
不支持 |
不支持 |
Gemma-7B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
不支持 |
不支持 |
GLM4-9B |
|
|
|
|
Atlas 800I A2推理产品(64G)支持的长度最长为1M |
GLM-V3-6B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
GPT-NEOX-20B |
|
|
不支持 |
不支持 |
不支持 |
InternLM-20B |
|
|
不支持 |
不支持 |
不支持 |
InternLM2-20B |
|
|
不支持 |
|
Atlas 800I A2推理产品(64G)支持的长度最长为200K |
LLaMa-7B |
|
|
不支持 |
不支持 |
不支持 |
LLaMa-13B |
|
|
不支持 |
不支持 |
不支持 |
LLaMa-33B |
|
|
稀疏量化:仅Atlas 300I Duo 推理卡支持 |
不支持 |
不支持 |
LLaMa-65B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
LLaMa2-7B |
|
|
|
|
不支持 |
LLaMa2-13B |
|
|
|
|
不支持 |
LLaMa2-70B |
|
|
|
|
不支持 |
LLaMA3-8B |
|
|
不支持 |
|
不支持 |
LLaMA3-70B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
|
Atlas 800I A2推理产品(64G)支持的长度最长为256K |
LLaMA3.1-8B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
LLaMA3.1-70B |
|
|
|
|
Atlas 800I A2推理产品(64G)支持的长度最长为128K |
Mistral-7B |
|
|
不支持 |
不支持 |
不支持 |
Mixtral-8x7B-Instruct-V0.1-8X7B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
不支持 |
不支持 |
Mixtral-8x22B-InstructV0.1-8X22B |
|
|
不支持 |
不支持 |
不支持 |
Qwen-7B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
Qwen-14B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
Qwen-72B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
Qwen1.5-7B |
|
|
不支持 |
|
不支持 |
Qwen1.5-14B |
|
|
|
|
不支持 |
Qwen1.5-32B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
Qwen1.5-72B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
Qwen1.5-110B |
|
|
W8A16量化:仅Atlas 800I A2推理产品支持 |
不支持 |
不支持 |
Qwen2-57B-A14B |
|
|
不支持 |
|
不支持 |
Qwen2-7B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
Qwen2-72B |
|
|
|
|
Atlas 800I A2推理产品(64G)支持的长度最长为128K |
Qwen2.5-7B |
|
|
不支持 |
不支持 |
不支持 |
Qwen2.5-14B |
|
|
不支持 |
不支持 |
不支持 |
Qwen2.5-32B |
|
|
不支持 |
不支持 |
不支持 |
Qwen2.5-72B |
|
|
不支持 |
不支持 |
不支持 |
StarCoder-15.5B |
|
|
W8A8量化:支持 |
|
不支持 |
StarCoder2-15B |
|
|
W8A8量化:仅Atlas 800I A2推理产品支持 |
|
不支持 |
TeleChat12B-V2-12B |
|
|
稀疏量化:仅Atlas 300I Duo 推理卡支持 |
不支持 |
不支持 |
Vicuna-7B |
|
|
不支持 |
不支持 |
不支持 |
Vicuna-13B |
|
|
不支持 |
不支持 |
不支持 |
Yi-6B-200K-6B |
|
|
不支持 |
不支持 |
不支持 |
Yi-34B-200K |
|
|
不支持 |
不支持 |
Atlas 800I A2推理产品(64G)支持的长度最长为200K |
Ziya-Coding-34B |
|
|
不支持 |
不支持 |
不支持 |