我想从 CIA 档案馆下载特定搜索词的 PDF 文件。例如,对于“越南”,URL 为https://www.cia.gov/library/readingroom/search/site/Vietnam。
单击每个链接后可以查看PDF文件,是否可以通过修改以编程方式下载PDF文件wget -A pdf https://www.cia.gov/library/readingroom/search/site/Vietnam
谢谢你!
答案1
也许这会有所帮助!
首先,将所有下载文件或 URL 存储在文本文件中:
$ cat > 下载文件列表.txt
网址1
网址2
网址3
网址4
回显“输入文字”
文本=$1
猫 URL.txt | grep -i $text > /tmp/new.txt
wget -i /tmp/new.txt