关于训练结果ACC指标下降的问题 #788

xjDUAN184 · 2024-05-14T10:24:12Z

模型为bge-m3
我使用了450条训练数据，其中每条数据包括，1个query sentence，1个pos sentence，7个neg sentence。
其中7个neg sentence，有两种情况：
1 其中有1个neg sentence是标注的，剩下的6个是随机匹配的（满足bgemodel.compute_score小于0.7）
2 7个全都是随机生成的。
1个npos sentence，有两种情况：LLM生成的或者手动标注的。

从实验结果中可以发现，当我的权重配比中，sparse不为0时，acc会降低，这种情况是为什么？

staoxiao · 2024-05-15T03:20:59Z

Based on the results, sparse retrieval might not be suitable for your data. You can choose the best way to use it.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于训练结果ACC指标下降的问题 #788

关于训练结果ACC指标下降的问题 #788

xjDUAN184 commented May 14, 2024 •

edited

staoxiao commented May 15, 2024

关于训练结果ACC指标下降的问题 #788

关于训练结果ACC指标下降的问题 #788

Comments

xjDUAN184 commented May 14, 2024 • edited

staoxiao commented May 15, 2024

xjDUAN184 commented May 14, 2024 •

edited