我在使用 Google 电子表格时遇到了问题。
问题是,我和我的同事正在使用一个电子表格作为翻译表格,其中有一列英语进而德语和法语并且每行都有特定的文本需要翻译。
我们需要翻译带有 HTML 标签的文本,例如
<span style="color:#AC0000">请翻译<strong>此</strong>内容</span>
实际上 HTML 标签比这还多,而我的同事们并不真正“兼容 HTML”,所以我的问题是,是否有可能为他们隐藏这些 HTML 标签,使它们仅对我可见,或者有什么方法可以更方便。当然,有可能复制这些文本而不进行 HTML 格式化,然后再次格式化最终翻译,但这会花费大量时间。
我很乐意接受所有建议,并提前感谢您!
答案1
使用 Google 电子表格删除 HTML 标签的方法如下:
=RegexReplace( A1, "<\/\w+>|<\w+.*?>", "" )
其中 A1 是包含 HTML 的单元格
笔记
- 对于 A1 中的每个 HTML 标签,A1 必须具有开始
<
和结束>
- 纯文本(非 HTML)应该避免<和>因为它可能会导致假阳性。
如果不进行逐字翻译,您不太可能以编程方式获取翻译后的文本并注入原始 HTML。这是因为有些单词会翻译成多个单词,并且句子结构在翻译时可能会发生变化。