Skip to content

zhouyongjie/LLMs_api_service

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 

Repository files navigation

LLMs_api_service

一、介绍


实现了一个简单的 Openai 接口形式的大模型对话服务,支持如下模型:

ChaGLM3、ChatGLM2、Codegeex2、Baichuan2、Qwen

二、环境


python 3.10

torch 2.0.0+cu118

transformers 4.33.2

peft 0.6.0 (如果使用peft加载模型)

二、使用说明

  1. 配置参数:

    使用前请配置:api_service.py 中的 root_model_hub_path,配置为自己的大模型根目录地址

  2. 启动服务

    uvicorn api.api_service:app --host 0.0.0.0 --port 4100
  3. 接口文档可查看 https://your_ip:3101/redoc

  4. 请求服务

    • api:http://your_ip:3101/v1/chat/completions
    • 请求方式:POST

    示例:

       {
          "model": "THUDM/chatglm3-6b",
          "messages": [
            {"role": "user", "content": "你好"}
            ],
          "stream": true,
          "max_tokens": 512,
          "temperature": 0.1
       }

三、参考


About

Openai style api for Open LLMs

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages