如何对字幕文件中的多行文本进行拼写检查

如何对字幕文件中的多行文本进行拼写检查

我有一个如下所示的 .srt 文件:

1
00:00:06,862 --> 00:00:09,408
It's the first sense you use when you're born.

2
00:00:09,408 --> 00:00:11,283
One out of every fifty of your genes

3
00:00:11,283 --> 00:00:12,625
is dedicated to it.

这些是我正在翻译的 TEDed 视频的字幕。我想检查我写的内容的拼写和语法,但我找不到方法。大多数浏览器和字幕编辑器都有某种拼写检查功能,但它们所做的只是检查字典中是否存在一组字母。我有软件可以检查拼写和语法,并考虑上下文,但它不知道如何读取 .srt 文件。

所以我想我需要一种方法来忽略文件中的所有“非文本”部分,并删除回车符,并且在完成后能够返回到 srt 文件。

我正在考虑使用某种隐形字符,这种字符会被我的拼写检查器忽略,但可以标记需要剪切的行的位置。

有任何想法吗 ?

答案1

虽然这不是问题的自动或程序化解决方案,但这是我在翻译时通常处理此类文件的方式:

  • 如果字幕行没有在句子中间结束,我会保留原样。
  • 如果一个句子在下一个字幕行中继续,我会将所有部分(或至少是句子的其余部分)合并到第一行(这显然会变得太长)。
  • 然后,我使用提供的默认拼写工具,例如在 Microsoft Word 中。跳过包含时间信息的行非常容易。
  • 完成后,我会再检查一遍台词,并拆分过长的字幕。

显然,这远非完美,并且根据实际线路的长度,这可能非常困难或不可能做到。

答案2

使用此免费软件程序字幕工作坊就像我一样。程序使用 Word 的拼写检查器。因此,当您在“拼写检查器”对话框中时,只需单击“替换”或“全部替换”即可。到目前为止,我检查了大约 2000 个字幕。有时我会打开塞尔维亚语字幕,并使用 Subtitle Workshop 程序创建克罗地亚语字幕。

答案3

您没有包含任何有关操作系统环境的信息。对于 Linux,它不依赖扩展,因此任何文本编辑器都可以导入它。对于 Windows,如果记事本等太笨而无法打开它,请将扩展名重命名为 .txt。

相关内容