打开源代码网站时,是否真的会在显示时加载该页面的内容(任何引擎、脚本、图像、字体等)?如果只在新选项卡或空白页中输入 ViewSource: 然后输入 url,它只会将其重定向到搜索引擎。我目前通过打开页面 > 上下文菜单 > 然后输入 ViewSource,然后将该页面加入书签,然后在加载后粘贴我想要查看的新页面 URL 来查看源代码。
另外,在 Chrome 中查看页面源代码的最佳和最简单的快捷方法是什么?
答案1
不会。当浏览器正常加载页面时,它会下载 URL 指示的 html 文档并开始呈现代码。首先,它会读取 head 部分,并开始加载其中列出的每个文档(通常是脚本文件、css 样式表等)。它会将脚本代码添加到文档,并呈现标记,执行 onLoad 脚本,可能还会加载其他远程内容,最后按顺序应用 CSS 规则。这是一个完全呈现的页面。
当您不使用引擎来呈现页面时(使用浏览器查看源代码,或使用 wget/curl 等工具),您只会获得原始标记文档。不会处理任何子链接,也不会导入任何远程源。
一般来说,如果您想检查渲染的内容,您可以使用大多数常见浏览器中提供的开发人员工具(通常在 F12 上,因此您只需点击它即可)。
我的一个朋友曾经为一个网站编写了一个抓取工具,其中的内容在运行时由 CMS 框架注入到页面中。她必须将一个不可见的浏览器控件嵌入到她的应用程序中,并使用脚本完全呈现页面(无窗口的 Flash 广告会凭空出现),然后她才能访问完整的源代码以对其进行解析,从而获得指向内容的硬链接。