在 BASH 中查找 HTML 文档中使用的所有 ID 和 CLASS

Question 1

我需要找到所有的类等来找出一些 CSS 选择器试图匹配的内容 - 我使用了以下快速方法（适用于 Fedora 21 版本的 Bash）：

grep -Eoih class\=\"[^\"]*\" index.html | sed -e 's/"//g' -e 's/class=//g' | tr " " "\n" | sort -u

^{替换class为idID}

哪个：

grep -E- 扩展正则表达式（可能不需要），-o- 仅显示匹配的，-i不区分大小写，-h不打印文件名（对于多个文件）。
在class\=\"和之间"，匹配所有不是"
sed- 删除"并'class="
tr- 用换行符替换空格
sort- 按顺序排序并删除重复项

但它非常有限（例如，它是为使用"引号的东西设计的）。

为了删除多余的 CSS，我建议使用uncss，它会删除未使用的 CSS，这样您就不必手动执行此操作。您可以通过安装它npm install -g uncss，并像这样使用它（要获得更多选项，请使用uncss --help）：

  uncss ./index.html > new-css.css

注意，它会处理 HTML 等文件来查找所使用的 javascript、类和 id，因此您需要提供 HTML 作为输入。

Answer

我需要找到所有的类等来找出一些 CSS 选择器试图匹配的内容 - 我使用了以下快速方法（适用于 Fedora 21 版本的 Bash）：

grep -Eoih class\=\"[^\"]*\" index.html | sed -e 's/"//g' -e 's/class=//g' | tr " " "\n" | sort -u