字幕中的 : 代码代表什么?

字幕中的 : 代码代表什么?

我从 subscene 下载了字幕http://subscene.com/subtitles/the-5th-wave/english/1298314它包含一些编码,例如:<i>和 ,</i>它没有被我的播放器 mpv 解码。可以看出,字幕采用 .srt(Subrip Text)格式。

https://matroska.org/technical/specs/subtitles/srt.html

这是一个完整的对话,以便它可能有意义。

28
00:03:37,080 --> 00:03:39,280
CASSIE:<i> I miss the Cassie I was.</i>

我想解决这个问题,以便代码在游戏过程中不可见,但不知道如何解决。有人可以帮忙吗。我正在 Debian 测试并使用 mpv

[$] mpv --version                                                                                                               
(null) requires an argument
mpv 0.14.0 (C) 2000-2015 mpv/MPlayer/mplayer2 projects
 built on UNKNOWN
ffmpeg library versions:
   libavutil       54.31.100
   libavcodec      56.60.100
   libavformat     56.40.101
   libswscale      3.1.101
   libavfilter     5.40.101
   libswresample   1.2.101
ffmpeg version: 2.8.6-1+b2

期待如何解决这个问题。这些代码遍布整个 .srt 文件,因此充其量也有点令人不安。

答案1

看起来有人尝试使用 HTML 标签作为字幕并尝试制作字体斜体。以我有限的 HTML 知识,&lt;代表less than符号,即<&gt;代表>。所以

CASSIE:&lt;i&gt; I miss the Cassie I was.&lt;/i&gt;

可以可视化为

CASSIE:<i> I miss the Cassie I was.</i>

你可以很容易地看到这是斜体代码,视频播放器不理解 html 标签。我很确定它们可以通过一些选定的 sed/awk 组合来删除,例如

sed 's/\&lt\;i\&gt\;//; s+\&lt\;/i\&gt\;++' somefile.srt >somefile-nohtml.srt

相关内容