[获取用户标题]
之前看过某人发布如何通过单个帐户进行操作的帖子
我希望在 1-1000 范围内执行此操作并将其输出到 >> .txt
例子:
x@nine:~# wget -qO- 'http://www.twitter.com/10' | perl -l -0777 -ne 'print $1 if /<title.*?>\s*(.*?)(?: - twitter)?\s*<\/title/si' >> cat.txt
x@nine:~# wget -qO- 'http://www.twitter.com/11' | perl -l -0777 -ne 'print $1 if /<title.*?>\s*(.*?)(?: - twitter)?\s*<\/title/si' >> cat.txt
x@nine:~# 猫猫.txt
Tweets with replies by edo (@10) on Twitter
Tweets with replies by Stephen (@11) on Twitter
想要发布1-1000
答案1
我建议使用真正理解 HTML 的程序,而不是尝试使用 perl 自己解析它。一个问题是您的 perl 脚本仅解析任何标题标签的第一个实例,这对于管道命令来说并不理想。
下面我正在使用小狗解析网页中的 HTML,找到所有标题标签,然后打印其内容。自然地将 10 和 20 替换为您想要的范围。
wget -qO - https://twitter.com/{10..20} | pup 'title text{}'
结果输出
Tweets med svar fra edo (@10) | Twitter
Tweets med svar fra Stephen (@11) | Twitter
Twitter / Konto suspendert
13 (@13) | Twitter
Hazem Emam (@14) | Twitter
Tweets med svar fra 愛と平和の伝道師 (@15) | Twitter
@16 (@16) | Twitter
Sonja Cruz (@17) | Twitter
Twitter / Konto suspendert
One God (@19) | Twitter
Twitter / Konto suspendert