为什么从网页复制“查看源代码”数据,将其放入 word 文档中,然后在网页中重新打开它,结果显示的是文本文件而不是实际的 html?例如,假设我从 superuser.com 获取一些 html,进行轻微修改,然后尝试运行它。有什么会阻止我看到该页面吗?
答案1
任何网站的页面都只是从远程服务器传输到您的计算机以便您的浏览器呈现它们的 HTML 文件。(实际情况要复杂得多,大多数情况下它们可以即时生成,并且还有单独的图像文件与 HTML 文件一起传输,以便浏览器可以将图像放置在页面上,还有描述行为的 javascript 和描述外观的 CSS。但为了回答这个问题,我们可以将其简化为我之前所说的内容)。
HTML 文件只是纯文本文件。它们必须包含特定标签(HTML 标签,用 括起来<>
),但除此之外,它们与任何 一样都是 ASCII 文本文件.txt
。如果您在任何浏览器上“查看源代码”,您只会看到浏览器在屏幕上呈现之前收到的 HTML 文件的确切内容。
现在,你的浏览器不再关心在哪里HTML 文件来自哪里。它可以来自网站,也可以来自计算机上的文件夹。您甚至可以将文件拖到.html
浏览器窗口,它会尝试呈现它(由于缺少图像、javascript 和 css,它可能会出现问题和异常,但至少会有一些内容)。
查看源代码后,将其复制并粘贴到 Word 中,然后另存为文本,您只是在计算机上创建一个新的 HTML 文件。该文件将缺少所有图像、javascript 和 CSS,但除此之外,它将是一个完全有效的 HTML 文件。你在屏幕上看到的内容将是浏览器正确呈现的最佳尝试。
为了说明我的意思,我打开了这个问题的确切页面,将代码粘贴到记事本上,将其保存到文件夹中并打开。结果如下(请注意,我没有看到任何单个 HTML 标签,只有文本!):
根据浏览器的不同,如果你只是将文件扩展名更改为,.txt
它将显示文件的源代码、HTML 标签和所有内容,而不是渲染它。Windows 7 上的 Firefox 31 至少可以做到这一点。
请注意,如果您将 HTML 粘贴到 Word 上并将其保存为.doc
或.docx
文件,然后在浏览器里打开,你看到的都是乱码,因为浏览器不是用来渲染Word文件的。
答案2
使用记事本(不是 Word)将其保存为文本文件,将其重命名为 .html 或 .htm,然后在浏览器中打开。当然,如果您了解扩展名何时实际更改以及何时不更改,您可以将保存和重命名合并为一个操作。不同之处在于 Word 还会写入看不见的信息……记事本则不会。