如何计算 UTF-16LE/CR-LF/BOM 文件中的行数？

Question 1

我会将文件转换为带有 LF 行结尾的 UTF-8，这样我就可以直接使用本机工具：

$ iconv -f UTF-16LE -t UTF-8 myfile.txt | dos2unix | wc -l

这dos2unix部分是最棘手的部分。该工具有许多变体，但并非所有变体都知道如何在管道中使用。有时它也被称为其他名称，例如d2u.

Answer

我会将文件转换为带有 LF 行结尾的 UTF-8，这样我就可以直接使用本机工具：

$ iconv -f UTF-16LE -t UTF-8 myfile.txt | dos2unix | wc -l

这dos2unix部分是最棘手的部分。该工具有许多变体，但并非所有变体都知道如何在管道中使用。有时它也被称为其他名称，例如d2u.

Question 2

下面是一个 perl 脚本，它以 UTF-16（通过 BOM 检测到字节顺序）打开文件（作为命令行参数给出），并计算行数。

#! /usr/bin/env perl
use strict;
use warnings;

while (my $file = shift @ARGV) {
    my $fh;
    if (!open($fh, '<:encoding(UTF-16)', $file)) {
        print STDERR "Failed to open [$file]: $!\n";
        next;
    }
    my $count = 0;
    $count++ while (<$fh>);
    print "$file: $count\n";
    close $fh;
}

（如果不理解 BOM，则死亡。）

Answer

下面是一个 perl 脚本，它以 UTF-16（通过 BOM 检测到字节顺序）打开文件（作为命令行参数给出），并计算行数。

#! /usr/bin/env perl
use strict;
use warnings;

while (my $file = shift @ARGV) {
    my $fh;
    if (!open($fh, '<:encoding(UTF-16)', $file)) {
        print STDERR "Failed to open [$file]: $!\n";
        next;
    }
    my $count = 0;
    $count++ while (<$fh>);
    print "$file: $count\n";
    close $fh;
}

（如果不理解 BOM，则死亡。）

Question 3

如果您的 dos2unix 版本 >= 7.1，您可以使用 -i 选项来获取有关换行符数量的信息。还支持 UTF-16 文件。当文件有 BOM 时，dos2unix 自动检测它是 UTF-16、LE 或 BE。当文件没有 BOM 时，您可以使用选项 -ul 来告诉它是 UTF-16LE（或 -ub 表示 UTF-16BE）。

dos2unix -i 将按顺序打印 DOS、Unix 和 Mac 换行符的数量。示例（带 BOM）：

$ dos2unix -i utf16le.txt
      50       0       0  UTF-16LE  text    utf16le.txt

无物料清单：

$ dos2unix -ul -i utf16len.txt
      50       0       0  no_bom    text    utf16len.txt

请参阅手册了解更多信息。

Answer

如果您的 dos2unix 版本 >= 7.1，您可以使用 -i 选项来获取有关换行符数量的信息。还支持 UTF-16 文件。当文件有 BOM 时，dos2unix 自动检测它是 UTF-16、LE 或 BE。当文件没有 BOM 时，您可以使用选项 -ul 来告诉它是 UTF-16LE（或 -ub 表示 UTF-16BE）。

dos2unix -i 将按顺序打印 DOS、Unix 和 Mac 换行符的数量。示例（带 BOM）：

$ dos2unix -i utf16le.txt
      50       0       0  UTF-16LE  text    utf16le.txt

无物料清单：

$ dos2unix -ul -i utf16len.txt
      50       0       0  no_bom    text    utf16len.txt

请参阅手册了解更多信息。

如何计算 UTF-16LE/CR-LF/BOM 文件中的行数？

答案1

答案2

答案3

相关内容