有没有办法下载论坛 jpeg 图像附件,可能使用 Wget 或 Curl 或其他工具?我想从论坛上的特定页面下载 jpeg 附件。我不想下载所有论坛附件,而是下载特定于线程中页面的附件。我也不想一次下载一个附件。我希望能够访问论坛上的页面并使用一个命令/操作从该页面下载所有附加图像。
我可以使用 Firefox Addon 检索论坛附件 URL复制所有链接:
http://forum.sample.com/attachmentshow.php?attachmentid=5332197&d=1391102903
http://forum.sample.com/attachmentshow.php?attachmentid=5332198&d=1391102903
http://forum.sample.com/attachmentshow.php?attachmentid=5332199&d=1391102903
http://forum.sample.com/attachmentshow.php?attachmentid=5683368&d=1407242372
但如果我可以给 Wget 或 Curl(或其他一些工具)论坛页面的 url,命令会自动检索附件 url 并下载图像,那就更方便了。
答案1
为了获取不一定在 URL 中使用文件名后缀的图像或文件的链接,我将使用 wget 和该--accept-regex
选项。我已经根据您的具体情况更改了我使用的脚本:
wget -nd -r -l 2 --accept-regex '/attachmentshow' www.domain.tld
解释:
-nd
无目录,以防止在递归检索时创建目录层次结构。-r
启用递归检索,请参阅递归下载了解详情。-l
指定递归最大深度级别,可能希望将其更改为您的特定意图。--accept-regex
指定一个正则表达式来接受 URL。
您还可以用来-A
指定应接受哪些文件名后缀,请参阅递归接受/拒绝选项了解详情。
当遇到机器人.txt您可以使用该选项-e robots.off
来忽略 robots.txt 文件。我确实建议先阅读该选项及其后果。
您可以阅读有关 wget 的更多信息手册页。
我希望您能够根据您的需要调整示例并解决问题。