使用任意网络浏览器(例如 Firefox),您可以保存网页(完整网页),并将其中的 html 文件(例如 n.html)和网页元素保存在相应的目录 n_files 中。
在 Win7 中,如果您复制、移动、重命名 html 文件的文件夹,它们将作为一个单元进行修改。但是,Nautilus(默认的 Gnome 文件管理器)不会这样做。
是否有可用的 Nautilus 脚本来启用此功能?还有其他方法可以实现相同的目的吗?
答案1
我认为 Explorer 中的重命名功能是基于 Explorer 识别的文件系统中的特殊属性(Explorer 中大多数此类功能都是这样工作的)。在 GNOME / Nautilus 中可以实现类似的功能(前提是您使用的文件系统支持扩展属性),但据我所知,目前尚不存在。
另一种可能性是编写一个 nautilus 插件,使用一些启发式方法来检测这样的 html 文件+相应的目录并执行您想要的操作,但我同样不知道现有的解决方案(正确实现它也并不简单)。
我建议使用 Firefox 的 UnMHT 插件将页面保存在一个文件中(也许其他浏览器也有类似的功能)。
与 Mozilla 存档格式 (又名 MAF) 不同,MHT (又名 MHTML) 已在官方规范 (RFC2557) 中标准化,并且还受到 IE 和其他应用程序的支持,这使其更具前瞻性。Opera 和 Safari 也有 MHT 查看插件。
http://www.unmht.org/en_index.html(Firefox 扩展 + Opera、Safari 和 QuickLook 查看器)
Firefox 插件也在 Mozilla 的插件网站上。
答案2
您可以使用 wget 下载整个内容。
wget -r --level=0 --convert-links --page-requisites --no-parent http://url.com
-r 表示它是递归的
--level=0 表示它会下降到无限的级别(所以http://url.com/pictures/babes/pics.html将被保存,而不仅仅是顶级页面)
--convert-links 表示将链接从 转换<a href="http://url.com/page.html">link</a>
为<a href="page.html">link</a>
--page-requisites 表示它会下载正确显示页面所需的所有内容。如图像、javascript 等。
--no-parent 表示不下载“更高”的页面。因此,如果您想要http://url.com/graphics/index.html和“下面”,http://url.com/index.html将不会被下载。
答案3
有一个 Firefox 扩展用于将网页及其所有支持内容保存在一个文件中:Mozilla 存档格式(带有忠实保存)。我个人没有用过,但听起来这就是你想要的。