Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

自动识别换行符 #530

Open
ZeyuDong1 opened this issue May 8, 2023 · 7 comments
Open

自动识别换行符 #530

ZeyuDong1 opened this issue May 8, 2023 · 7 comments
Labels
enhancement New feature or request

Comments

@ZeyuDong1
Copy link

希望能够自动识别换行符,然后根据前后文判断是否需要将换行符替换为空格。

@ZeyuDong1 ZeyuDong1 added the enhancement New feature or request label May 8, 2023
@lupguo
Copy link

lupguo commented May 21, 2023

+1,希望能优化空行的展示,目前将换行符替换成空格会导致翻译可读性变差,希望支持仅移除空行功能,比如:

The options are as follows:

     -4      Forces ssh to use IPv4 addresses only.

     -6      Forces ssh to use IPv6 addresses only.

仅移除空行后,效果变为和下述效果一致:

The options are as follows:
     -4      Forces ssh to use IPv4 addresses only.
     -6      Forces ssh to use IPv6 addresses only.

20230521_113226

@ZoyDo @ripperhe

@ripperhe
Copy link
Owner

貌似你俩说的不是一回事儿?

@lupguo
Copy link

lupguo commented May 21, 2023

貌似你俩说的不是一回事儿?

我理解应该没有什么大的差别,都是针对可读性的问题讨论(目前替换换行成空格,全部挤在一堆了)。

我截图只是提了一个更具体解决方式。

@ripperhe

@ripperhe
Copy link
Owner

貌似你俩说的不是一回事儿?

我理解应该没有什么大的差别,都是针对可读性的问题讨论(目前替换换行成空格,全部挤在一堆了)。

我截图只是提了一个更具体解决方式。

@ripperhe

好的,明白你意思了。

从你举例来看,你的重点应该是中间有空行,影响阅读,直接去掉空行即可,这个好实现的。

不过 @ZoyDo 侧重点可能是某种场景下,一句话分成了两段,用换行替换为空格的目的是想把这两段话合并为一句话,不然会影响翻译结果。这个就需要判断两段话本身到底是不是一句话,如果两段话是一句话,那就将换行替换为空格合并成一句话,如果不是,那就保持换行,这个需求我目前没啥好的思路。

@lupguo
Copy link

lupguo commented May 23, 2023

貌似你俩说的不是一回事儿?

我理解应该没有什么大的差别,都是针对可读性的问题讨论(目前替换换行成空格,全部挤在一堆了)。
我截图只是提了一个更具体解决方式。
@ripperhe

好的,明白你意思了。

从你举例来看,你的重点应该是中间有空行,影响阅读,直接去掉空行即可,这个好实现的。

不过 @ZoyDo 侧重点可能是某种场景下,一句话分成了两段,用换行替换为空格的目的是想把这两段话合并为一句话,不然会影响翻译结果。这个就需要判断两段话本身到底是不是一句话,如果两段话是一句话,那就将换行替换为空格合并成一句话,如果不是,那就保持换行,这个需求我目前没啥好的思路。

是否是一句话,简单实现就是用英文标点符号作为断句而不是通过换行符,用换行替换空格通常不会对原语句有影响,目前看Bob呈现结果是符合预期的,并未出现影响翻译结果的情况

【空行并未影响翻译结果】
image

【换行替换空格并未影响翻译结果】
image

但空行在有的场景下的确会影响阅读,一些空行过多的情况会导致原文布局松散,需要通过滚动条下翻才能同步。

总之,还是希望可以考虑做“空行移除”优化,或者最好可以支持自定义正则匹配替换(在控制面板的文本处理部分,比如将/^\s*[\r\n]/gm 替换成 空字符串),这样灵活性就更高一些。

Eg.

const str = "Hello,\n\n\nWorld!";

// 使用正则表达式来匹配空行并替换为空字符串
const newStr = str.replace(/^\s*[\r\n]/gm, "");

console.log(newStr);
// Output: "'Hello,\nWorld!'"

@ripperhe

@ripperhe
Copy link
Owner

「简单实现就是用英文标点符号作为断句而不是通过换行符」这个我感觉会有很多 bad case,不过后续可以实测体验,如果大部分场景下能适用,也可以作为一个选项提供。

「空行并未影响翻译结果」这个可以多测试几个翻译服务,确实可能会影响翻译结果的。

「换行替换空格并未影响翻译结果」恩,目前这个选项,在句子本来是一句,然后被拆成了多行的情况下,合并起来是符合预期的。但是如果本来不是一行的话,强行合并 ,可能结果就不符合预期了。我猜正是因为如此,@ZoyDo 才希望动态判断。

「希望可以考虑做“空行移除”优化」这个会考虑的。

@findyy99
Copy link

OCR的时候能换行一下吗,要不然识别多行数据,直接就是一长串。 @ripperhe

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

4 participants