vLLM 0.4.2版本参考适配代码

适配代码仓的目录结构如下所示:

├── cover
│   ├── requirements-ascend.txt
│   ├── setup.py
│   └── vllm
│      └── __init__.py
├── examples
│   ├── start_server.sh
│   ├── test_offline.py
│   └── test_offline.sh
├── install.sh
│   └──vllm_npu
├── requirements.txt
├── setup.py
│   └── vllm_npu
├── __init__.py
├── attention
│   ├── __init__.py
│   ├── backends.py
│   └── selector.py
├── config.py
├── core
│   └── __init__.py
├── engine
│   ├── __init__.py
│   ├── ascend_engine.py
│   └── async_ascend_engine.py
├── executor
│   ├── __init__.py
│   ├── ascend_executor.py
│   ├── ascend_ray_executor.py
│   └── ray_utils.py
├── model_executor
│   ├── __init__.py
│   ├── ascend_model_loader.py
│   ├── layers
│   │   ├── __init__.py
│   │   └── ascend_sampler.py
│   └── models
│   │   ├── __init__.py
│   │   └── ascend
│   │    │   ├── __init__.py
│   │    │   └── mindie_llm_wrapper.py
├── npu_adaptor.py
├── usage
│   ├── __init__.py
│   └── usage_lib.py
├── utils.py
│   └── worker
├── __init__.py
├── ascend_model_runner.py
├── ascend_worker.py
└── cache_engine.py

其中主要包括如下四个部分

  1. cover文件夹下包含了对vllm框架源码的修改内容。
  2. examples文件夹下包含了离线模式和在线模式的使用实例代码。
  3. vllm_npu文件夹下包含了补丁仓的源码内容。
  4. install.sh为一键式安装脚本,在将所有的代码文件都还原后,即可运行该脚本一键安装昇腾适配版的vllm框架,其中会自动拉取源码安装vllm原生框架并打上适配补丁。

代码仓中各个文件的代码内容