如何列出网页上的所有链接 (DownThemAll!)?

如何列出网页上的所有链接 (DownThemAll!)?

我如何下载这些链接(不是链接指向的页面内容,只是链接本身)。我试图将大约 300 个视频的列表提供给我的网络管理员以解除阻止,但他只想要 URL。

答案1

在 PHP 中:

<?php

$webpagehtml=file_get_contents("http://www.example.com");

$dom=new DOMDocument();
$dom->loadHTML($webpagehtml);

$xpath=new DOMXPath($dom);
$items = $xpath->query("//a");

$links=array();

for ($i = 0;  $i < $items->length; $i++ ) {
$item = $items->item($i);
$title=$item->textContent;
$href=$item->getAttribute('href');

if($href && $title){
echo "$href = $title<br/>";
}
}
?>

在 Python 中,使用http://arshaw.com/scrapemark/docs/examples/

或者你可以使用向下在 Firefox 中做这些脏活。

答案2

当我想查看网页上的链接时,我会从存档中取出 Avant 浏览器(版本 10)的旧副本并安装它。运行您想要的网页。右键单击页面并选择“打开此页面中的所有链接”。您无法剪切和粘贴它们。

相关内容