关于测试您的模型的问题 #8

jjyu-ustc · 2023-06-20T05:52:47Z

作者您好！我对您的工作非常感兴趣，同时我拿了您发布的权重，想要测试一下您的模型，结果发现效果并不是很理想，我问的是几个您在文档中有提及的问题，下面是我的测试记录

llama-7b模型本身就非常容易陷入胡说八道的情况，目前我也在做和您类似的工作，我用的是alpaca-7b的lora 微调算法，发现效果要远好于llama。同时扩充中文词汇量的工作也有人做过了，lora训练后的效果有大幅提升。不知道您接下来是否会尝试一下？目前我的工作发现用chinese-alpaca lora精调，比用llama、vicuna精调的效果都好很多。

jerry1993-tech · 2023-06-20T12:49:36Z

jjyu-ustc

非常感谢你的反馈！
是的，llama-7b 会存在生成的结果文不对题、以及无法自然地结束生成等情况。
我们正在选用更好的中文基础模型如 baichuan-7B等继续做金融领域的多任务SFT 模型。
本项目-聚宝盆作为开源项目，欢迎大家积极参与与贡献idea、代码、数据！

luxinglong · 2023-09-15T05:45:02Z

在baichuan2这种具有一定金融领域知识的基座模型上，是否还有必要进一步进行二次预训练呢？

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于测试您的模型的问题 #8

关于测试您的模型的问题 #8

jjyu-ustc commented Jun 20, 2023

jerry1993-tech commented Jun 20, 2023 •

edited

luxinglong commented Sep 15, 2023

关于测试您的模型的问题 #8

关于测试您的模型的问题 #8

Comments

jjyu-ustc commented Jun 20, 2023

jerry1993-tech commented Jun 20, 2023 • edited

luxinglong commented Sep 15, 2023

jerry1993-tech commented Jun 20, 2023 •

edited