保存 HTML 文件时删除所有脚本代码

保存 HTML 文件时删除所有脚本代码

我保存并归档了大量 Paypal 收据,这些文件包含大量存档所不需要的垃圾脚本代码。我想找到一种方法来删除所有这些代码,这样我就可以删除包含的 javascript 文件以节省空间,而不会破坏收据的外观。

尝试使用 Notepad++ 中的“查找和替换”功能,使用以下正则表达式(未在“替换”字段中输入任何内容)

<script.*?/script>

这似乎解决了大部分问题,但为所有已删除的代码留下了空白行。有没有更好的方法?

答案1

您可以使用它(\r\n)*<script.*?/script>(\r\n)*来删除脚本标签以及其前导和尾随的空行。

答案2

我已经测试过了,接受的答案只捕获<script>包含在一行中的标签,并且不捕获前导空格来处理空白行。使用\s将捕获所有空格字符,包括多行脚本块中标签之间的换行符。如下所示:

(\s)*<script[\s\S]*?\/script>(\s)*

相关内容