使用NPU swift infer 后端支持VLLM吗 #886

zhengxingmao · 2024-05-09T02:58:25Z

使用NPU swift infer 后端支持VLLM吗

Jintao-Huang · 2024-05-09T03:41:26Z

不支持的

zhengxingmao · 2024-05-09T06:45:27Z

有计划支持吗？
另外swift infer在使用GPU卡中后端使用vllm 支持OpenAI API服务方式吗？

Jintao-Huang · 2024-05-09T08:07:58Z

gpu是支持的

是vllm本身不支持npu啦, 不是ms-swift不支持

Jintao-Huang · 2024-05-09T08:08:13Z

使用swift deploy

zhengxingmao · 2024-05-11T05:22:08Z

好的，那么NPU推理时可以指定多卡吗

Jintao-Huang self-assigned this May 9, 2024

Jintao-Huang added the question Further information is requested label May 9, 2024

Provide feedback