-
-
Notifications
You must be signed in to change notification settings - Fork 666
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
使用中文翻译后返回的字幕文件格式是分开的,语句不完整就换行了 #345
Comments
当我使用你的文本,generated的srt是如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 我觉得它不是split by sentences的(应该是by phrase),so你可能需要做一些文本与字幕处理。但是希望之后的更新作者可以把这一块变成句子分行srt |
首先这位作者不说中文,其次这个edge-tts做的是语音转文字的功能,和翻译无关,你找错地方了吧 |
edge-tss运行得到的每个WordBoundary都是一个字或一个词,且没有标点符号,需要自己开发去比对原文进行各句字幕的组装。 |
是的,但是不影响语音的拼接组装啊,语音转文字的功能没问题啊,我转出来的就是有正常停顿的语音,和微软edge大声朗读读出来的语音是一样的。 |
不是已有字幕文件才能做语音转文字吗?我就是这么做的,为什么要再拼接组装一次? |
#346 可以解决这个问题 |
这个可行,它是split based on 中文的句号 "。" 楼主可能做一些标点符号的处理,来生成相对于的output |
换行和句号都行,效果也还可以接受
|
@chnyangjie |
你好,使用中文翻译后返回的字幕文件格式很奇怪,比如我使用以下内容去翻译:
从李闻骁床上起来
他懒洋洋地把内衣递给我
「我把大门密码改了
以后没事儿别来了 」
我一愣 下意识问
「为什么 」
他勾唇笑道
「她昨天答应当我女朋友了 」
可是返回的字幕变成以下内容:
正常应该是返回这种格式更正确:
我用了最新版本使用的以下命令:
能帮我看看问题是出在哪里吗?
The text was updated successfully, but these errors were encountered: