Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[技术咨询] 关于复合时间文本和事件信息提取 #164

Open
QAbot-zh opened this issue Sep 9, 2023 · 1 comment
Open

[技术咨询] 关于复合时间文本和事件信息提取 #164

QAbot-zh opened this issue Sep 9, 2023 · 1 comment

Comments

@QAbot-zh
Copy link

QAbot-zh commented Sep 9, 2023

咨询的功能模块

  • jionlp关于复合时间表达的时间提取准确性问题
  • jionlp是否有事件实体抽取(不确定是不是这个术语?)的接口

咨询的具体内容和问题
最近使用chatgpt搭建应用的时候,做了一个备忘录功能,主要是通过prompt引导让大模型从自然语言文本中提取时间和事件信息,目前使用准确性极高。也如作者在wiki文章里说的,用大模型一是有点牛刀杀鸡的感觉,二是调用时间上会比本地的nlp package要长,所以也在寻找合适的中文nlp库进行替代,然后就找到jionlp这个库了。不得不说是除大模型外、目前使用起来时间信息提取准确性最好最快的python库了,给大佬点个大大的赞。但是也发现一些问题:

  • jionlp库对于复合时间文本的时间提取准确性会变差,如下图中,有时候只关注了“国庆节”,有时候只关注了“第二天”,对于这种带有时间复合的文本在处理上,有什么比较好的方法嘛?
    image
  • 事件实体/信息的提取,如前面所说的,我需要做备忘录功能,关注的信息就是时间和事件信息,在功能介绍中似乎还没有这方面的接口,文本总结和关键词提取的接口试了下,也不太适合。这块功能的接口会纳入后续的考虑嘛,或者作者有相关功能的库推荐吗?

附上ChatGPT的解析示例:

ChatGPT-备忘录测试

注意事项

  • 技术咨询前请先认真阅读readme, wiki

  • 请顺手 star 一下右上角的⭐小星星

@QAbot-zh QAbot-zh changed the title [技术咨询] [技术咨询] 关于复合时间文本和事件信息提取 Sep 9, 2023
@dongrixinyu
Copy link
Owner

复合时间就推荐用大模型来搞。正则来搞成本太大。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants