我第一次尝试运行 PERL 脚本。
这里是 :http://search.cpan.org/dist/HTML-ExtractMain/lib/HTML/ExtractMain.pm
我以前从未使用过 PERL,我发现给出的文档非常混乱/难以理解(文档很小)。我在 Windows 7 中构建了它,并运行了
./Build test
命令在 README 文件中建议。它表示它已通过并且所有依赖项都已安装。
然而,我的问题很简单,如何使用这个脚本?!:) 我怀疑以前使用过 PERL 的人可能会更明白。对我来说,文档全是胡言乱语。
有人能发一个如何使用这个脚本的例子吗?
假设我有一个 html 页面 index.html 并希望从中提取主要元素。
我该怎么办?
答案1
它本身不是一个脚本,而是一个模块。模块源链接在页面顶部(源链接)。您需要将模块保存到您的系统中才能使用它。
之后,您编写自己的脚本来导入该模块,然后就可以在脚本中使用该模块中的函数。
该页面有一个使用该模块的示例脚本。我将其包含在下方,并对其功能进行了注释:
#import the module, make it available to use further down the script
use HTML::ExtractMain qw( extract_main_html );
#define some HTML data, save in the $html variable
my $html = <<'END';
<div id="header">Header</div>
<div id="nav"><a href="/">Home</a></div>
<div id="body">
<p>Foo</p>
<p>Baz</p>
</div>
<div id="footer">Footer</div>
END
#call the extract_main_html function that is defined in the module
my $main_html = extract_main_html($html, output_type => 'xhtml');
#if you get results from the function call, do something with the results
if (defined $main_html) {
# do something with $main_html here
# $main_html is '<div id="body"><p>Foo</p><p>Baz</p></div>'
}