我想知道是否可以让 wget 使用 -tag 之间的字符串作为文件名。
有数百份文件需要从内部网站下载(全部合法),但该网站有点糟糕。使用不带任何参数的 wget 会得到类似这样的文件名"c0f506da-0184-d621-7ab2-c0300875bda3,11111111-1111-1111-1111-111111111111.pdf"
。使用带有 – content-disposition 的 wget 会得到正确的文件名(如"AB1999.pdf"
),但网站内使用的文件名并不好。正确的名称应为网站上显示的名称:之间的字符串<a href=...>STRING</a>
将是完美的名称。
有没有办法让 wget 使用这个 ahref 字符串作为文件名?我阅读了帮助/文档,但就是找不到它。
如果没有:是否有其他方法可以实现这一点(在下载/下载管理器中使用 ahref 字符串作为文件名)?
答案1
我让浏览器显示网站的源代码,并将其复制/导入到 Excel/Notepad++ 中,然后用它来转换行(搜索/替换)。
所以我改变了
<a href="../../med/c5b/c5b704b3-4afd-7851-2e58-2f5241a133e2,11111111-1111-1111-1111-111111111111.pdf" target="_blank" title="A proper Filename - Opens a new window">A proper Filename</a> <br>
进入
wget -O "A proper filename.pdf" "http://mywebsite//med/475/47570cd0-f77c-af51-93ca-0763041a133e,11111111-1111-1111-1111-111111111111.pdf"
虽不完美,但确实有效。
祝您有个愉快的一天,亚历克斯