You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
reacted with thumbs up emoji reacted with thumbs down emoji reacted with laugh emoji reacted with hooray emoji reacted with confused emoji reacted with heart emoji reacted with rocket emoji reacted with eyes emoji
-
我这里有一份关于王者荣耀的数据,包含了图像,语音,文字,很想RAG做点东西,但是好多东西没用过, 没做过, 想找有经验的小伙伴们一起做下, 包含三种模态的数据集,我还没有尝试过,有没有感兴趣的
想实现这样的效果, 基于RAG,可以同时支持语音, 图片和文字同时检索/训练的方案啊, 主要我还想加图片以及语音的检索, 但是没见过有做这个的, 就一头雾水
爬取更多数据
同时, 数据还不够完整, 需要爬取更多, 爬虫擅长的小伙伴, 可以来帮帮忙
英雄人物关系提取和对比验证
此外, 游戏里的英雄实际上是有关系的, 也想把这个知识赋予给他,实际上是知识图谱, 但是主要是简单的实体关系, 没有知识图谱那么复杂, 举例下: 人物A-人物B-关系-关系描述text
目前的话, 王者网站上是提供了这样的数据的, 王者英雄故事中也有对不同英雄之间的复杂关系有一定的体现, 关于知识图谱的部分, 其实王者数据里面有这种数据, 同时他提供的文本里也可以进行一定的NER提取, 我目前打算先用他提供的作为训练数据, 看看, 他自己能不能在背景故事中提取到类似知识图谱的人物关系
是否能找到比较好的API, 来抽取人物关系, 起到类似知识图谱的作用, 这个我是期待的, 能做到这个, 就很好了
提高回答时的数据可靠性
这个数据集, 最需要的是尽可能的按照数据中的数据做出准确回答, 对于数据集中没提供的内容, 添加搜索功能和调用工具挺好的, 同时, 英雄的数值和技能也可以能会有改动(王者数据更新频率, 一般一周或者两周一次吧,), 能否添加下和网站最新数据的对比验证, 提高搜索检索数据的可靠性.
考虑过使用ms-agent, 应该可以通过搜索直接去pvp王者网站搜索,或者通过prompt, 但是效果怎么样, 需要实践下, 这种就可以避免, 后面数值更新来造成的不便, 可以进行下搜索验证,
我觉得这个做了, 可能访问量挺高的, 后期还想打算做个微信接口, 不过好多都没尝试过
对此感兴趣的小伙伴, 请联系微信kwchg0901
Beta Was this translation helpful? Give feedback.
All reactions