使用 Excel 从在线社区抓取 XPath 数据

Question

根据 Firefox/Firebug，用户 Twitter URL 的唯一 XPath 是：

/html/body/div[2]/div/div/div[1]/div/div[2]/a[1]

这与您的第一次尝试略有不同。注意：我修改了我的第一次尝试，您不希望/i在末尾使用，否则您会得到内部元素，而不是<a>带有 url 的元素。

但是，您的第二次尝试肯定会找到包含 URL 的正确 HTML 元素，并且它更加健壮。

尽管您的第三次尝试可以在 Google Docs ImportXML 中使用，但它无法与 XPathOnUrl 一起使用，因为它不支持属性语法。

Answer 1

根据 Firefox/Firebug，用户 Twitter URL 的唯一 XPath 是：

/html/body/div[2]/div/div/div[1]/div/div[2]/a[1]

这与您的第一次尝试略有不同。注意：我修改了我的第一次尝试，您不希望/i在末尾使用，否则您会得到内部元素，而不是<a>带有 url 的元素。

但是，您的第二次尝试肯定会找到包含 URL 的正确 HTML 元素，并且它更加健壮。

尽管您的第三次尝试可以在 Google Docs ImportXML 中使用，但它无法与 XPathOnUrl 一起使用，因为它不支持属性语法。

相关内容