整体微调以后，领域内的知识记住了，但是问常规问题，比如你好，你叫什么，他也回答领域内的知识 #206

heiheiwangergou · 2023-04-27T02:12:53Z

是我参数哪里设置的不对嘛，a100单卡，14000条qa数据下面是训练参数

'max_seq_length': 1024, # 如果资源充足，推荐长度2048 与官方保持一致
'max_target_length': 100,  # 预测最大长度, 保留字段

这两个参数会影响结果嘛

The text was updated successfully, but these errors were encountered:

cywjava · 2023-04-27T02:56:52Z

+1

cristianohello · 2023-04-28T03:39:07Z

+1

lianrzh · 2023-04-30T07:56:06Z

是全量微调，还是lora训练？

lxw0109 · 2023-05-10T02:41:57Z

+1
尝试了全量微调、lora训练都试过了，都有灾难性遗忘的情况，灾难性遗忘的情况lora稍强一点，但两种训练方式的拟合效果都不好
训练数据只有300条，epoch: 1, max_seq_length: 2048，其他超参基本没动

liu459977653 · 2023-05-25T11:59:50Z

同问

Provide feedback