我如何下载这些链接(不是链接指向的页面内容,只是链接本身)。我试图将大约 300 个视频的列表提供给我的网络管理员以解除阻止,但他只想要 URL。
答案1
在 PHP 中:
<?php
$webpagehtml=file_get_contents("http://www.example.com");
$dom=new DOMDocument();
$dom->loadHTML($webpagehtml);
$xpath=new DOMXPath($dom);
$items = $xpath->query("//a");
$links=array();
for ($i = 0; $i < $items->length; $i++ ) {
$item = $items->item($i);
$title=$item->textContent;
$href=$item->getAttribute('href');
if($href && $title){
echo "$href = $title<br/>";
}
}
?>
在 Python 中,使用http://arshaw.com/scrapemark/docs/examples/。
或者你可以使用向下在 Firefox 中做这些脏活。
答案2
当我想查看网页上的链接时,我会从存档中取出 Avant 浏览器(版本 10)的旧副本并安装它。运行您想要的网页。右键单击页面并选择“打开此页面中的所有链接”。您无法剪切和粘贴它们。