转换大文件时出现错误:
$ iconv -f GB2312 -t UTF-8 2001.txt -o 2001_u.txt
iconv: illegal input sequence at position 245256667
这个错误中的位置是什么意思?我试过了,不是行号。如何到达emacs等其他工具或编辑器中的位置?
答案1
这是文件的 245256667 字节。如果您执行以下操作:
dd if=2001.txt of=error.txt bs=1 count=10 skip=245256667
你应该能够通过执行以下代码来查看无效的 utf8 序列hexdump -C error.txt
答案2
有了vim
你就可以
:go POSITION+1
例如
:go 245256668
或者,在命令模式下:
POSITION+1go
那是
245256668go