train模式和test模式差别很大 #276

dle666 · 2024-04-18T06:30:31Z

我对一张图片微调至过拟合，训练过程中生成的答案与真值已经完全相同，但是我加载此模型去测试同一张图发现，生成的结果和真值句式和顺序的差别很大，这是为什么呢，请给我一些帮助

yuhangzang · 2024-04-22T11:24:22Z

Did you set .eval() mode during inference?

dle666 · 2024-04-22T13:07:09Z

您在推理过程中是否设置了 .eval() 模式？

我已经设置了eval，并且我发现当我把在geo3k的训练集上lora微调后的模型（loss已下降到0.03）再次加载在同一数据集上进行训练时，loss又变为了1.7，是否是模型保存或加载出现了问题（原代码加载微调后的模型会报错，我是使用automodel加载的）

dle666 · 2024-04-22T13:07:46Z

您在推理过程中是否设置了.eval()模式？

您在推理过程中是否设置了.eval()模式？

我已经设置了eval，并且我发现当我把在geo3k的训练集上lora参数后的模型（loss已恢复到0.03）再次加载在相同数据集上进行时，loss又变成了1.7，是否是模型保存或加载出现了问题（原代码加载操作后的模型会报错，我是使用automodel加载的）

补充一下，我在全参数微调时并没有遇见这种情况

yuhangzang · 2024-04-23T04:07:15Z

It looks like your LoRA model is not loaded correctly. Do u use the AutoPeftModelForCausalLM class here?

dle666 · 2024-04-23T04:10:42Z

您的 LoRA 模型似乎未正确加载。你用这里的AutoPeftModelForCausalLM课程吗？

我在测试的时候是用这个加载的，再次微调也使用这个来加载吗？

dle666 · 2024-04-23T04:11:45Z

您的LoRA模型似乎未正确加载。您用这里的AutoPeftModelForCausalLM课程吗？

我在测试的时候是用这个加载的再次，调节也使用这个来加载吗？

补充一下，在测试过程中使用AutoPeftModelForCausalLM加载并不能解决训练loss和测试结果不对齐的问题

mm-assistant bot assigned LightDXY Apr 18, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

train模式和test模式差别很大 #276

train模式和test模式差别很大 #276

dle666 commented Apr 18, 2024

yuhangzang commented Apr 22, 2024

dle666 commented Apr 22, 2024

dle666 commented Apr 22, 2024

yuhangzang commented Apr 23, 2024

dle666 commented Apr 23, 2024

dle666 commented Apr 23, 2024

train模式和test模式差别很大 #276

train模式和test模式差别很大 #276

Comments

dle666 commented Apr 18, 2024

yuhangzang commented Apr 22, 2024

dle666 commented Apr 22, 2024

dle666 commented Apr 22, 2024

yuhangzang commented Apr 23, 2024

dle666 commented Apr 23, 2024

dle666 commented Apr 23, 2024