Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[建议]在合并翻译行数不一致时提供行号 #223

Open
Andy-AO opened this issue Mar 8, 2024 · 6 comments
Open

[建议]在合并翻译行数不一致时提供行号 #223

Andy-AO opened this issue Mar 8, 2024 · 6 comments
Labels
enhancement New feature or request

Comments

@Andy-AO
Copy link
Contributor

Andy-AO commented Mar 8, 2024

如果合并翻译出现了行数不一致,那么通常可以手工修复。

有的时候段落非常长,比如说有12,000字,那么检查哪里出了问题是很困难的。

但是如果有行号的话就简单多了,可以采用二分查找的方式,快速排除错误。

先定位到中间行,然后检查行号相同的段落是否一致,不断缩小范围,问题很快就能排除。

由于现在的UI没有行号,所以需要复制粘贴到其他文本编辑器中,完成之后再粘贴回来,这样会造成不必要的浪费。

因此建议在UI中添加行号,尤其是翻译行数不一致的时候,以供快速排错。

@Andy-AO
Copy link
Contributor Author

Andy-AO commented Mar 8, 2024

我们可以做一个假设,通常来说译文和原文的字数不会相差太大,如果原文是100字符,译文大概率不是10个字符。
那么还建议检查行是否一致,没有办法准确检查,但可以提示疑似高度不一致的结果,然后进行标注,这样发现和纠正问题将更快。

@bookfere
Copy link
Owner

bookfere commented Mar 8, 2024

行号是可行的。

我们可以做一个假设,通常来说译文和原文的字数不会相差太大,如果原文是100字符,译文大概率不是10个字符。 那么还建议检查行是否一致,没有办法准确检查,但可以提示疑似高度不一致的结果,然后进行标注,这样发现和纠正问题将更快。

但是,没太理解这个描述。目前只要行数不一致就会标记成黄色,还需要疑似高度不一致这个条件吗?。

另外,除了 ChatGPT 这种可能丢失行,Google 翻译之类的有时也会出现错误,比如翻译多行时只返回一行。

@bookfere bookfere added the enhancement New feature or request label Mar 8, 2024
@Andy-AO
Copy link
Contributor Author

Andy-AO commented Mar 8, 2024

行号是可行的。

我们可以做一个假设,通常来说译文和原文的字数不会相差太大,如果原文是100字符,译文大概率不是10个字符。 那么还建议检查行是否一致,没有办法准确检查,但可以提示疑似高度不一致的结果,然后进行标注,这样发现和纠正问题将更快。

但是,没太理解这个描述。目前只要行数不一致就会标记成黄色,还需要疑似高度不一致这个条件吗?。

另外,除了 ChatGPT 这种可能丢失行,Google 翻译之类的有时也会出现错误,比如翻译多行时只返回一行。

行数不一致的话,我们只知道整体有问题,因此在条目列表的UI上标注为黄色,这个是已经实现的功能。

如果查看文本的UI上有了行号的话,那么我们也想知道具体是从哪一行开始有了问题,这就需要依据假设进行猜测,这个假设可以是字符数明显不同。

猜测出来之后在对应的行上也进行标注,比如高亮或者波浪线,这样可以便于排错。

@bookfere
Copy link
Owner

bookfere commented Mar 9, 2024

了解了。不过根据字符数标记问题位置感觉不太可靠,因为没有判断不同语言之间原文的译文长度比例的依据。另外,这种标记要在识别十分精准的情况下才可行,否则可能会让人疑惑。

@Andy-AO
Copy link
Contributor Author

Andy-AO commented Mar 9, 2024

了解了。不过根据字符数标记问题位置感觉不太可靠,因为没有判断不同语言之间原文的译文长度比例的依据。另外,这种标记要在识别十分精准的情况下才可行,否则可能会让人疑惑。

这是一个能够极大方便排错的功能,根据我的经验,出现这种情况意味着在该位置的前方不远处,问题已经出现。

我理解你的担心,正如你所说,它会带来一些问题,不过我认为这些问题可以有解决方案,这里分享一下我的思考。

  1. 有的人可能无法理解,这只是个高度疑似的提醒,我认为这可以通过不默认开启该功能来解决,这样如果有人需要的话,那么他会手动开启该功能,开启的时候就会看到该功能的名称,从而理解是什么意思
  2. 译文和原文的比值也可以自定义,默认可以是0.1,也就是1:10,如果需要可以增大或减小。

@bookfere
Copy link
Owner

bookfere commented Mar 9, 2024

感觉这个想法不错。让用户自定义应该能消除之前提到的疑惑。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

2 participants