我从 subscene 下载了字幕http://subscene.com/subtitles/the-5th-wave/english/1298314它包含一些编码,例如:<i>
和 ,</i>
它没有被我的播放器 mpv 解码。可以看出,字幕采用 .srt(Subrip Text)格式。
https://matroska.org/technical/specs/subtitles/srt.html
这是一个完整的对话,以便它可能有意义。
28
00:03:37,080 --> 00:03:39,280
CASSIE:<i> I miss the Cassie I was.</i>
我想解决这个问题,以便代码在游戏过程中不可见,但不知道如何解决。有人可以帮忙吗。我正在 Debian 测试并使用 mpv
[$] mpv --version
(null) requires an argument
mpv 0.14.0 (C) 2000-2015 mpv/MPlayer/mplayer2 projects
built on UNKNOWN
ffmpeg library versions:
libavutil 54.31.100
libavcodec 56.60.100
libavformat 56.40.101
libswscale 3.1.101
libavfilter 5.40.101
libswresample 1.2.101
ffmpeg version: 2.8.6-1+b2
期待如何解决这个问题。这些代码遍布整个 .srt 文件,因此充其量也有点令人不安。
答案1
看起来有人尝试使用 HTML 标签作为字幕并尝试制作字体斜体。以我有限的 HTML 知识,<
代表less than
符号,即<
,>
代表>
。所以
CASSIE:<i> I miss the Cassie I was.</i>
可以可视化为
CASSIE:<i> I miss the Cassie I was.</i>
你可以很容易地看到这是斜体代码,视频播放器不理解 html 标签。我很确定它们可以通过一些选定的 sed/awk 组合来删除,例如
sed 's/\<\;i\>\;//; s+\<\;/i\>\;++' somefile.srt >somefile-nohtml.srt