将两个连续的 CR 替换为一个

将两个连续的 CR 替换为一个

cat -e file.txt给出:

{"yellow":"mango"}^M$
^M$
{"yellow":"banana"}^M$
^M$
{"yellow":"blabla"}^M$
^M$

我只想:

{""yellow":"mango"}^M$
{"yellow":"banana"}^M$
{"yellow":"blabla"}^M$

适用于文件夹中所有带有 txt 扩展名的文件。因此我尝试:

find . -type f -name "*.txt" -print0 | xargs -0 sed -i "s/^M$^M$/^M$/g"

无济于事。有人有更好的主意吗?

head -n 3 file.txt | od -bc

产量:

0000000 173 042 171 145 154 154 157 167 042 072 042 155 141 156 147 157
          {   "   y   e   l   l   o   w   "   :   "   m   a   n   g   o
0000020 042 175 015 012 015 012 173 042 142 141 142 141 142 042 072 042
          "   }  \r  \n  \r  \n   {   "   b   a   b   a   b   "   :   "
0000040 155 141 156 147 157 042 175 015 012
          m   a   n   g   o   "   }  \r  \n
0000051

这:

awk 1 RS='\r\n' ORS= < file.txt

完全删除新行(所以这并不好:我想保留每行连续的两个中的一个,但它确实做了一些事情)。

答案1

您可以使用sed -z 's/\r\n\r\n/\r\n/g'

通常sed一次只能处理一行。通过使用该-z选项,sed将处理以字节分隔的行0,这些行通常不存在于文本文件中,因此整个文件将被视为一行,并且可以替换换行符。

(发现于堆栈溢出并附加了解释)

答案2

您还可以删除仅包含回车符的行。

  • 使用 GNU Sed:

    sed '/^\r$/d' file
    
  • 对于最小但符合 POSIX 的机器(这里我们需要用 Printf 生成回车符):

    sed "/^$(printf "\r")$/d" file
    

^匹配行首和最后一个$,即行尾(\n)。

例如:

$ cat -e file
AB^M$
^M$
CB^M$
^M$
$ sed '/^\r$/d' file|cat -e
AB^M$
CB^M$

答案3

如果可以删除所有空白行,你可以执行以下操作:

perl -wlne '/\S/ and print' old_file > new_file

如果您希望覆盖文件,则可以使用-i(就地)开关:

perl -wlni.bak -e '/\S/ and print' file1 file2 file3 ...

上面这行代码会将原始文件复制为*.bak文件。如果你不介意备份,那么你可以省略这.bak部分,如下所示:

perl -wlni -e '/\S/ and print' file1 file2 file3 ...

(您甚至可以使用通配符,因此file1 file2 file3 ...您可以写file*. )

这种方法的优点是它可以一次性更改所有文件(而不必为每个文件运行一次)。

但请记住:这只会保留至少包含一个非空白字符的行。因此,如果一行仅包含五个空格、一个制表符、一个回车符和一个换行符,则不会保留该行。

答案4

使用 Raku(以前称为 Perl6 的语言)

~$ raku -ne '.put if /\S/ ;' test_blank.txt
{"yellow":"mango"}
{"yellow":"banana"}
{"yellow":"blabla"}

上面的例子只打印包含非空白字符的行(\S匹配一个非空白的字符)。下面是一个非常易读的版本:

~$ raku -ne '.put if .chars;' test_blank.txt
{"yellow":"mango"}
{"yellow":"banana"}
{"yellow":"blabla"}

嗨嗨。

https://raku.org
https://rakudo.org/downloads

相关内容