请问 srt|ass|vtt|lrc 这四种格式中的哪一种最“干净”,即最接近没有元信息或时间信息的文本?
答案1
非常感谢 - gronostaj (Polak? to dziekuje po polsku) - Ryan 和 - Anaksunaman
我用这个处理了 VTT 格式并得到了一个漂亮的“干净”的 txt:
grep '<[0-9][0-9]:[0-9][0-9]:[0-9][0-9].[0-9][0-9][0-9]>' 26.11subsMéxico.txt | sed 's/<[0-9][0-9]:[0-9][0-9]:[0-9][0-9].[0-9][0-9][0-9]>//g' | sed 's$$$g' >clean.txt