Lynx 从文件中读取 url 并下载链接

Question 1

这是一个改进的脚本：

#!/bin/sh
cat file.txt |while read url
do
    lynx -listonly -dump "$url"
done |
awk '/^[ ]*[1-9][0-9]*\./{sub("^ [^.]*.[ ]*","",$0); print;}'| \
sort -u

允许 lynx 识别的任何类型的 URL（例如包括 ftp）。该脚本对结果进行排序，消除重复项（lynx 本身不会这样做）。

进一步阅读：

山猫用户指南

Answer

这是一个改进的脚本：

#!/bin/sh
cat file.txt |while read url
do
    lynx -listonly -dump "$url"
done |
awk '/^[ ]*[1-9][0-9]*\./{sub("^ [^.]*.[ ]*","",$0); print;}'| \
sort -u

允许 lynx 识别的任何类型的 URL（例如包括 ftp）。该脚本对结果进行排序，消除重复项（lynx 本身不会这样做）。

进一步阅读：

山猫用户指南

Question 2

调用 list.txt 你的列表：

for i in $(cat list.txt) 
do 
  lynx -accept_all_cookies -dump $i |grep "http" |sed -e "s/^.*http/http/"
done

我建议将输出重定向到某个文件。

Answer

调用 list.txt 你的列表：

for i in $(cat list.txt) 
do 
  lynx -accept_all_cookies -dump $i |grep "http" |sed -e "s/^.*http/http/"
done

我建议将输出重定向到某个文件。

Lynx 从文件中读取 url 并下载链接

答案1

答案2

相关内容