为什么 sort.exe 在 32 位 Windows 上截断大输出？

Question 1

好的，所以问题与文件大小完全无关。似乎是因为文件是在文本模式下打开的，并且在末尾附近包含一个 0x1A（Windows 上的 ^Z 或 EOF）字符。

一旦在输入过程中遇到此字符，它就会停止读取。没有办法解决这个问题，因为没有标志以二进制方式打开文件。

我应该更快地找到它，但挖掘 1.5GB 的文件并不容易 :)

Answer

好的，所以问题与文件大小完全无关。似乎是因为文件是在文本模式下打开的，并且在末尾附近包含一个 0x1A（Windows 上的 ^Z 或 EOF）字符。

一旦在输入过程中遇到此字符，它就会停止读取。没有办法解决这个问题，因为没有标志以二进制方式打开文件。

我应该更快地找到它，但挖掘 1.5GB 的文件并不容易 :)

Question 2

如果文件包含不可打印字符，您不想忽略它们。删除 -i 选项并使用 LC_ALL=C 运行。

例如

export LC_ALL=C
sort -k 1,10 -s <file_to_sort.txt >out.txt

Answer

如果文件包含不可打印字符，您不想忽略它们。删除 -i 选项并使用 LC_ALL=C 运行。

例如

export LC_ALL=C
sort -k 1,10 -s <file_to_sort.txt >out.txt

相关内容