如何将文本文件的一部分逐字节复制到另一个文本文件？ dd，头，还是？

2024-5-25 • tag-icon

我需要抓取长文本文件的第一行，以便对较小的文件进行一些错误修复（Python 脚本不会按预期消化大文本文件）。然而，为了使错误修复有意义，我确实需要这些行是完美的副本，基本上是逐字节的，并找出字符编码、行尾字符、不可见字符或不存在的任何潜在问题。原来的txt.

我认为文本文件在中线结束是没有问题的，因此复制一些特定的字节大小可以完成我想要做的事情。两者head似乎dd都能够做到这一点，但man head说要处理文本文件并将man dd标准输入复制到标准输出（并提供转换工具），我无法验证他们是否进行了逐位复制，没有任何转换或损失。因此，以下两个解决方案似乎在测试中有效，但我不确定我是否正在对任何可能的问题字符进行测试。明确的答案或其他更好的解决方案将是最有帮助的。

任何一个

dd if=input.txt of=output.txt bs=256 count=1

或者

head -c 256 input.txt > output.txt

另请参阅原始的、更具体的问题这里。

相关内容