使用方法

    2024-04-22 简化
    2023-10-09 support accelerator trainer
    2023-10-07 support colossalai trainer
    2023-09-26 support transformers trainer
    2023-08-02 增加 muti lora infer 例子, 手动升级 aigc_zoo , pip install -U git+https://github.com/ssbuild/deep_training.zoo.git --force-reinstall --no-deps
	2023-06-13 support resize_token_embeddings
    2023-06-01 支持lora deepspeed 训练，0.1.9 和 0.1.10合并
    2023-05-27 add qlora transformers>=4.30
    2023-05-24 升级 lora

update information

deep_training
t5 训练精度推荐使用 32

install

pip install -U -r requirements.txt
如果无法安装，可以切换官方源 pip install -i https://pypi.org/simple -U -r requirements.txt

weight

data

open data

p prefix  optional
q question optional
a answer   must

 {
    "id": 0, 
    "p": "我是qwen训练的模型",
    "paragraph": [
        {
           "q": "你好",
           "a": "我是机器人，有什么可以帮助你的？"
        },
         {
             "q": "从南京到上海的路线",
             "a":  "你好，南京到上海的路线如下：1. 南京到上海，可以乘坐南京地铁1号线，在南京站乘坐轨道交通1号线。2. 南京到浦东机场，可以搭乘上海地铁1号，在陆家嘴站乘坐地铁1线，在浦东国际机场站乘坐机场快线，前往上海浦东国际机场。3. 上海到南京，可以换乘上海地铁2号线，从南京站换乘地铁2线，再从南京南站换乘地铁1路，然后到达上海站"
         }
     ]
 }

或者

 {
    "id": 0,
    "conversations": [
      {
        "from": "system",
        "value": "我是qwen训练的模型"
      },
      {
        "from": "user",
        "value": "你好"
      },
      {
        "from": "assistant",
        "value": "我是机器人，有什么可以帮助你的？"
      },
      {
        "from": "user",
        "value": "从南京到上海的路线"
      },
      {
        "from": "assistant",
        "value": "你好，南京到上海的路线如下：1. 南京到上海，可以乘坐南京地铁1号线，在南京站乘坐轨道交通1号线。2. 南京到浦东机场，可以搭乘上海地铁1号，在陆家嘴站乘坐地铁1线，在浦东国际机场站乘坐机场快线，前往上海浦东国际机场。3. 上海到南京，可以换乘上海地铁2号线，从南京站换乘地铁2线，再从南京南站换乘地铁1路，然后到达上海站"
      }
     ]
 }

使用方法

默认不使用滑动窗口
data_conf = {
    'stride': 0,
    #滑动窗口 , 数据多则相应增大，否则减小 ,stride <=0 则禁用滑动窗口
}

infer

# infer_finetuning.py 推理微调模型
# infer_lora_finetuning.py 推理微调模型
# infer_ptuning.py 推理p-tuning-v2微调模型
 python infer_finetuning.py

training

    # 制作数据
    cd scripts
    bash train_full.sh -m dataset 
    or
    bash train_lora.sh -m dataset 
    or
    bash train_ptv2.sh -m dataset 
    
    注: num_process_worker 为多进程制作数据 ， 如果数据量较大 ， 适当调大至cpu数量
    dataHelper.make_dataset_with_args(data_args.train_file,mixed_data=False, shuffle=True,mode='train',num_process_worker=0)
    
    # 全参数训练 
        bash train_full.sh -m train
        
    # lora adalora ia3 
        bash train_lora.sh -m train
        
    # ptv2
        bash train_ptv2.sh -m train

训练参数

友情链接

纯粹而干净的代码

Name		Name	Last commit message	Last commit date
Latest commit History 117 Commits
config		config
data		data
infer		infer
scripts		scripts
training		training
.gitignore		.gitignore
README.md		README.md
args.MD		args.MD
data_processer.py		data_processer.py
data_utils.py		data_utils.py
requirements.txt		requirements.txt
train.py		train.py

ssbuild/t5_finetuning

Folders and files

Latest commit

History

Repository files navigation

update information

install

weight

data

使用方法

infer

training

训练参数

友情链接

About

Topics

Resources

Stars

Watchers

Forks

Languages