请问llm_type为llama时，模型权重文件必须为model/stable-vicuna-13B.ggml.q4_2.bin吗？权重文件是否可以为llama2？以及策略是否支持fp16? #534

15229684931 · 2024-04-30T02:27:44Z

我在npu上进行测试时，迁移了wenda的代码，在适配llama时，config.yaml如下配置
llama: path: "/home/ch/stable-vicuna-13B-HF" strategy: "npu fp16"

但是在web端推理时，出现了回答不全的现象

The text was updated successfully, but these errors were encountered:

Provide feedback