httrack
是一个可以复制网站的程序。我从他们的网站为基于 Linux 的计算机下载了该文件,然后提取了这些文件,但现在如果我去查找该文件。我无法运行该程序或任何东西,它只是显示为一堆随机文件,例如,,,html
等等……lang
libtest
我如何才能实际运行该文件?我是 Linux 新手,所以请提供简单的说明。
答案1
如果你不知道是否可以在此目录中找到源代码,那么最好使用apt
此命令安装该包
sudo apt-get install httrack
一切正常,您可以通过终端启动 httrack 来下载互联网;)
httrack "http://www.google.com/" -O "/tmp/www.google.com"
不,抱歉,请替换google.com
为您的目标 URL。
困难的方式:
安装助手
sudo apt-get install checkinstall
编译并安装
cd wget http://download.httrack.com/httrack-3.48.21.tar.gz tar xf httrack-3.48.21.tar.gz cd httrack-3.48.21 ./configure make sudo checkinstall
您也可以使用
sudo make install
而不是sudo checkinstall
。
答案2
您可以使用多种替代方法wget
来检索远程网页。
wget
是一笔财富。你可以做很多你想象不到的事情。
我httrack
以前也试过,它是我在 Windows 平台上最喜欢的。当我切换到 Ubuntu 时,我也再次尝试了它,但结果并不如我所料,后来我偶然知道了它的优点wget
。我给自己做了一个.bashrc
我经常使用的命令。
crwl() {
wget --tries=inf --timestamping --recursive --level=inf --convert-links --page-requisites --no-parent "$@"
}
将上述函数复制到您的终端中然后从用户目录中.bashrc
获取您的文件或注销并登录。.bashrc
source .bashrc
这就是我的功能,您可以根据您的需要进行修改。
你可以像这样使用它:
crwl www.site.com/somelink
更多资源:
答案3
答案4
使用 Linux 平台时优先获得而不是 httrack。wget 或 web get 通过网络下载文件。它是非交互式的(在后台工作)。
以下命令将下载当前工作目录中的文件。wgethttp://website.com/files/file.zip
此图可以帮助您理解命令的用法 https://i.stack.imgur.com/hfu2j.jpg