从富文本中获取 HTML 标记代码的工具

从富文本中获取 HTML 标记代码的工具

想要一个专用的工具来快速实现下面提到的结果

编辑并可视化制作样式文本或从 MS-Word 或 RTF 导入并获取其标记 HTML(带有内联编码的文本)

我想要得到的是类似的东西:

<p class="home">
  <Span style="xxxxx">
    blah blah blah
  </span>
</p>

虽然它是 HTML,但我只想以快速的方式获取文本的 HTML 源代码

任何工具/技巧都值得赞赏

谢谢

答案1

在 Word 中您可以保存为 HTML,它会产生与你的例子不太相似的东西。

Word 的更高版本可以生成更好的 HTML(早期版本可以生成可用但难以阅读的重复且过于复杂的 HTML),因此您可能需要清理

有些人喜欢从纯文本标记使用类似潘多克

答案2

在 OS X 上,TextEdit 可以编辑 RTF 并保存为 html。以下是它输出的 HTML 类型的示例:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
   <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
   <meta http-equiv="Content-Style-Type" content="text/css">
   <title></title>
   <meta name="Generator" content="Cocoa HTML Writer">
   <meta name="CocoaVersion" content="1138.23">
   <style type="text/css">
      p.p1 {margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica}
   </style>
</head>
<body>
    <p class="p1">this is a <b>test</b></p>
</body>
</html>

答案3

你可以尝试未注册

  • Linux上述链接提供了版本。
  • 视窗版本这里
  • 操作系统让你使用它来安装自制brew install unrtf

例如,让我们创建一个 RTF 文档。

在此处输入图片描述

然后将其转换为 HTML(这是默认设置)。

unrtf test.rtf 

这是输出:

<!DOCTYPE html PUBLIC -//W3C//DTD HTML 4.01 Transitional//EN>
<html>
<head>
<meta http-equiv=content-type content=text/html charset=utf-8>
<!-- Translation from RTF performed by UnRTF, version 0.21.2 -->
<!--font table contains 0 fonts total-->
<!--invalid font number 0-->
</head>
<body><b><font size="3"><font color="#000000">This is a bold text<br>
<br>
<i>This is italics</i><br>
<br>
<u>This is underlined!</u></font></font></b></body>
</html>

相关内容