我需要抓取长文本文件的第一行,以便对较小的文件进行一些错误修复(Python 脚本不会按预期消化大文本文件)。然而,为了使错误修复有意义,我确实需要这些行是完美的副本,基本上是逐字节的,并找出字符编码、行尾字符、不可见字符或不存在的任何潜在问题。原来的txt.
我认为文本文件在中线结束是没有问题的,因此复制一些特定的字节大小可以完成我想要做的事情。两者head
似乎dd
都能够做到这一点,但man head
说要处理文本文件并将man dd
标准输入复制到标准输出(并提供转换工具),我无法验证他们是否进行了逐位复制,没有任何转换或损失。因此,以下两个解决方案似乎在测试中有效,但我不确定我是否正在对任何可能的问题字符进行测试。明确的答案或其他更好的解决方案将是最有帮助的。
任何一个
dd if=input.txt of=output.txt bs=256 count=1
或者
head -c 256 input.txt > output.txt
另请参阅原始的、更具体的问题这里。