Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[FEATURE]增加忽略特定关键词对命中率影响的功能 #314

Open
fitchibing opened this issue Apr 29, 2024 · 3 comments
Open

[FEATURE]增加忽略特定关键词对命中率影响的功能 #314

fitchibing opened this issue Apr 29, 2024 · 3 comments
Assignees

Comments

@fitchibing
Copy link

fitchibing commented Apr 29, 2024

MaxKB 版本

1.0.4

请描述您的需求或者改进建议

如我的 question 为:“我是一个名字很长很长的产品问题一”,其实只有问题一是关键信息,目前的版本这样则会因为“我是一个名字很长很长的产品”的前缀匹配到很多类似“我是一个名字很长很长的产品问题二/三/四/五/六/七/八”关联度比较低的段落,除非我录入了一个准确的“我是一个名字很长很长的产品问题一”

请描述你建议的实现方案

可以忽略特定关键词,这样在做向量查询的时候能更准确

附加信息

No response

@baixin513
Copy link
Contributor

感谢反馈,全文检索会根据词义进行检索,你可以先试用一下混合检索,精确度会提高。
我们也考虑一下。

@fitchibing
Copy link
Author

fitchibing commented Apr 30, 2024

不太明白,全文检索的描述写的是返回匹配文字最多的分段,那不正好是我提的这个场景的反例吗 “我是一个名字很长很长的产品问题一” 关键词实际只有问题一,但因为产品名字占比很高,所以匹配“我是一个名字很长很长的产品”这部分的内容最多,跟预期不一致了啊

@wwweber
Copy link

wwweber commented May 11, 2024

混合检索的参数和Rerank的模型在哪里可以灵活配置下?感觉如果检索灵活度能如Ragflow就完美了

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants