如何从网页中制作值列表？

Question

我假设你指的是维基百科上的特殊页面网页，https://en.wikipedia.org/wiki/Help:Special_page，这不完全是您在问题中提到的内容。

它生成有效的 XML，因此可以由 XML 工具（例如xmlstarlet.由此，您可以通过使用 XPath 路径识别页面并验证它们以以下内容开头来轻松列出页面Special:：

curl https://en.wikipedia.org/wiki/Help:Special_page |
    xmlstarlet sel -t -v '//ul/li/a[starts-with(text(),"Special:")]' -n

输出示例

Special:SpecialPages
Special:AllMessages (System messages)
Special:Statistics
Special:Version
Special:SiteMatrix (Wikimedia wikis)
Special:AllPages
Special:AllPages/T
...

您可以通过稍微更改路径来限制返回的页面名称集。最初我正在使用，/div[@id="mw-content-text"]/div/ul/li/a[starts-with(text(),"Special:")]但对于您简单的要求“来说，这似乎过于复杂”列出一个清单全部这些名字”。

Answer 1

我假设你指的是维基百科上的特殊页面网页，https://en.wikipedia.org/wiki/Help:Special_page，这不完全是您在问题中提到的内容。

它生成有效的 XML，因此可以由 XML 工具（例如xmlstarlet.由此，您可以通过使用 XPath 路径识别页面并验证它们以以下内容开头来轻松列出页面Special:：

curl https://en.wikipedia.org/wiki/Help:Special_page |
    xmlstarlet sel -t -v '//ul/li/a[starts-with(text(),"Special:")]' -n

输出示例

Special:SpecialPages
Special:AllMessages (System messages)
Special:Statistics
Special:Version
Special:SiteMatrix (Wikimedia wikis)
Special:AllPages
Special:AllPages/T
...

您可以通过稍微更改路径来限制返回的页面名称集。最初我正在使用，/div[@id="mw-content-text"]/div/ul/li/a[starts-with(text(),"Special:")]但对于您简单的要求“来说，这似乎过于复杂”列出一个清单全部这些名字”。

如何从网页中制作值列表？

答案1

相关内容