我注意到,如果 xml 文件的顶部file
有,Linux 命令不会返回任何值。如果缺少序言,则返回一些值。有人知道为什么会发生这种情况吗?我基本上想知道文件编码,并且发现它有点用处,但在 Linux 上有没有更好的方法可以找出编码和字符集?<?xml version="1.0" encoding="UTF-8"?>
file -i somefile.xml
file -i filename.xml
答案1
文件依赖于魔法文件中的签名,可以肯定它只查看序言,而不扫描文件的各个部分以保持简单。
答案2
猜测编码是一门暗黑艺术,甚至流行的浏览器也无法准确猜测。我建议你让你的解析器遵循 XML 编码,如果编码无效,则大声中断,并从源头修复编码错误。