Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

OCR指标存在一些diff #3

Open
dbylynn opened this issue Nov 21, 2022 · 3 comments
Open

OCR指标存在一些diff #3

dbylynn opened this issue Nov 21, 2022 · 3 comments

Comments

@dbylynn
Copy link

dbylynn commented Nov 21, 2022

作者您好:

我们所使用的矫正图均为github上贴的,但是我们评测的OCR指标与paper中的指标存在一些diff,我们的环境是mac os。

这是我们的tesseract以及pytesseract版本:

image

image

      这是我们复线的指标:

image

非常感谢您的工作,希望能得到您的解答!

@fh2019ustc
Copy link
Owner

fh2019ustc commented Nov 21, 2022

您好,谢谢你对我们工作的关注,以及感谢您提供的数据~!

关于这个问题,您可以参考一下DocTr的这个issue
Windows,Linux,Mac三个版本测出来的性能都略有不同,这是正常的。
对于我们的DocTr、DocScanner、DocGeoNet,我们都是在windows10下测试的。

为了这个领域的长期健康发展,我们也建议您可以在paper里注明你们自己的测试环境。
OCR性能对比,我觉得只要环境一致,对比的图像一致,我觉得没什么问题。

祝好~

@dbylynn
Copy link
Author

dbylynn commented Nov 24, 2022

好的,非常感谢您的解答!

还有一个问题,作者可以分享一下数据集 DIR300的矫正图吗?期待得到您的回复~

@fh2019ustc
Copy link
Owner

好的,我们最近两天会更新repo~

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants