我的目标是,使用 wget 将下面的打印历史记录(XML)页面提取到我的 Debian 框中,但不提取页面内容。
使用的命令:
wget -q http://192.168.8.93/wcd/job_history.xml
我得到的结果:
root@vm-debian:~/ar_lab# cat job_history.xml
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN">
<HTML lang="en">
<HEAD>
<TITLE></TITLE>
<meta http-equiv="Expires" content="0">
<meta http-equiv="Pragma" content="no-cache">
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
<meta content="text/javascript" http-equiv="Content-Script-Type">
<noscript>
<meta http-equiv="refresh" content="0; URL=/wcd/js_error.xml">
</noscript>
</HEAD>
<BODY BGCOLOR="#ffffff" LINK="#000000" ALINK="#ff0000" VLINK="#000000" onload="location.replace('/wcd/index.html?access=JOB_DON');" >
</BODY>
</HTML>
答案1
看起来您的打印机使用 Javascript 将页面重定向到正确的位置。
Wget 不理解 Javascript。
这里的简单解决方案是让您直接向重定向页面发出请求:
$ wget -q http://192.168.8.93/wcd/index.html?access=JOB_DON