我保存并归档了大量 Paypal 收据,这些文件包含大量存档所不需要的垃圾脚本代码。我想找到一种方法来删除所有这些代码,这样我就可以删除包含的 javascript 文件以节省空间,而不会破坏收据的外观。
尝试使用 Notepad++ 中的“查找和替换”功能,使用以下正则表达式(未在“替换”字段中输入任何内容)
<script.*?/script>
这似乎解决了大部分问题,但为所有已删除的代码留下了空白行。有没有更好的方法?
答案1
您可以使用它(\r\n)*<script.*?/script>(\r\n)*
来删除脚本标签以及其前导和尾随的空行。
答案2
我已经测试过了,接受的答案只捕获<script>
包含在一行中的标签,并且不捕获前导空格来处理空白行。使用\s
将捕获所有空格字符,包括多行脚本块中标签之间的换行符。如下所示:
(\s)*<script[\s\S]*?\/script>(\s)*