增加chatGLM2+PT的预测代码 #99

micrazy · 2023-09-07T08:11:31Z

Description

修改了模型保存方式，只保存PrefixEncoder部分
优化了训练过程的日志打印方式
新增了预测和cli代码

在chatGLM2+PT场景下，可以复现三元组抽取任务, 不同epoch的模型f1在测试集上表现为：

Epoch 1 0.4001908179539758
Epoch 5 0.48332597625972235
Epoch 7 0.5810401474342651
Epoch 10 0.5901889823940757

基本和作者的实验相符

micrazy · 2023-09-07T08:15:53Z

补充一句，随着训练轮数增加，会出现灾难性遗忘现象

Rorschach2333 · 2023-10-18T07:18:32Z

是真的，我感觉pt微调的遗忘问题非常严重，根本没有对话能力了

Rorschach2333 · 2023-11-01T03:38:53Z

在我的实验里只做了一次微调训练，但是结果貌似lora好很多，遗忘效果也没那么明显，我再试试多次训练后什么情况

micrazy · 2023-11-01T04:01:36Z

在我的实验里只做了一次微调训练，但是结果貌似lora好很多，遗忘效果也没那么明显，我再试试多次训练后什么情况

lora比pt好吗？

Rorschach2333 · 2023-11-01T07:27:00Z

我的实验结果是这样的，lora微调：
0.4670529755761953
0.49894855144855144
0.55351585129846
0.5553688147601193
0.5634696969696971
0.6320420851937882
0.5791721859418254
0.6105994321847981
0.620511885775044
0.6314630720323322
并且用第10轮的权重，仍然可以保持正常的沟通能力，测试的几个问题都能回答，但是ptv2我试了两个轮次，他连自己是谁都不知道了，根本没法用，测试精度大约是0.49（pt第二轮）
感谢你提供的脚本，这周组会又有救了

micrazy · 2023-11-01T07:32:57Z

我的实验结果是这样的，lora微调： 0.4670529755761953 0.49894855144855144 0.55351585129846 0.5553688147601193 0.5634696969696971 0.6320420851937882 0.5791721859418254 0.6105994321847981 0.620511885775044 0.6314630720323322 并且用第10轮的权重，仍然可以保持正常的沟通能力，测试的几个问题都能回答，但是ptv2我试了两个轮次，他连自己是谁都不知道了，根本没法用，测试精度大约是0.49（pt第二轮）感谢你提供的脚本，这周组会又有救了

很棒~

Zou-njust · 2023-12-01T06:35:47Z

在我的实验里只做了一次微调训练，但是结果貌似lora好很多，遗忘效果也没那么明显，我再试试多次训练后什么情况

你好，我尝试lora微调，生成的文件中没有pytorch_model.bin，但predict.py和cli.py中都需要这个文件，请问这里是怎么处理的？

Zou-njust · 2023-12-05T07:35:54Z

我的实验结果是这样的，lora微调： 0.4670529755761953 0.49894855144855144 0.55351585129846 0.5553688147601193 0.5634696969696971 0.6320420851937882 0.5791721859418254 0.6105994321847981 0.620511885775044 0.6314630720323322 并且用第10轮的权重，仍然可以保持正常的沟通能力，测试的几个问题都能回答，但是ptv2我试了两个轮次，他连自己是谁都不知道了，根本没法用，测试精度大约是0.49（pt第二轮）感谢你提供的脚本，这周组会又有救了

现在用下面的方式可以加载成功，
tokenizer = ChatGLMTokenizer.from_pretrained(args.model_dir)
config = PeftConfig.from_pretrained(args.lora_checkpoint)
model = AutoModel.from_pretrained(config.base_model_name_or_path, trust_remote_code=True).cuda()
model = PeftModel.from_pretrained(model, args.lora_checkpoint)
但使用predict.py分数全部为0，用cli问答，回答结果感觉和原始模型完全一样，怀疑是微调的部分哪里有问题，请问你是怎么操作的

nowyouseemejoe · 2023-12-09T07:27:34Z

我的实验结果是这样的，lora微调： 0.4670529755761953 0.49894855144855144 0.55351585129846 0.5553688147601193 0.5634696969696971 0.6320420851937882 0.5791721859418254 0.6105994321847981 0.620511885775044 0.6314630720323322 并且用第10轮的权重，仍然可以保持正常的沟通能力，测试的几个问题都能回答，但是ptv2我试了两个轮次，他连自己是谁都不知道了，根本没法用，测试精度大约是0.49（pt第二轮）感谢你提供的脚本，这周组会又有救了

现在用下面的方式可以加载成功， tokenizer = ChatGLMTokenizer.from_pretrained(args.model_dir) config = PeftConfig.from_pretrained(args.lora_checkpoint) model = AutoModel.from_pretrained(config.base_model_name_or_path, trust_remote_code=True).cuda() model = PeftModel.from_pretrained(model, args.lora_checkpoint) 但使用predict.py分数全部为0，用cli问答，回答结果感觉和原始模型完全一样，怀疑是微调的部分哪里有问题，请问你是怎么操作的

我也是这个问题，用了和你一样的代码加上model = model.merge_and_unload()，但是结果还是和原始模型一样，看了下好像参数都是原来的模型

micrazy added 4 commits September 7, 2023 15:59

Create run.sh

c117739

Update train.py

232c8e2

Create predict.py

bab4871

Create cli.py

dd51a8d

micrazy mentioned this pull request Sep 7, 2023

模型预测问题 #96

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

增加chatGLM2+PT的预测代码 #99

增加chatGLM2+PT的预测代码 #99

micrazy commented Sep 7, 2023

micrazy commented Sep 7, 2023

Rorschach2333 commented Oct 18, 2023

Rorschach2333 commented Nov 1, 2023

micrazy commented Nov 1, 2023

Rorschach2333 commented Nov 1, 2023

micrazy commented Nov 1, 2023

Zou-njust commented Dec 1, 2023

Zou-njust commented Dec 5, 2023

nowyouseemejoe commented Dec 9, 2023

增加chatGLM2+PT的预测代码 #99

Are you sure you want to change the base?

增加chatGLM2+PT的预测代码 #99

Conversation

micrazy commented Sep 7, 2023

micrazy commented Sep 7, 2023

Rorschach2333 commented Oct 18, 2023

Rorschach2333 commented Nov 1, 2023

micrazy commented Nov 1, 2023

Rorschach2333 commented Nov 1, 2023

micrazy commented Nov 1, 2023

Zou-njust commented Dec 1, 2023

Zou-njust commented Dec 5, 2023

nowyouseemejoe commented Dec 9, 2023