我有时会从客户那里收到带有错误文件扩展名的文件。例如,文件名称是,image.jpg
但文件实际上是 TIFF 图像。在许多情况下,我可以通过用文本编辑器打开文件,查看前几个字节,然后推断出它是哪种文件类型来澄清问题。
对我来说,这种方法适用于 JPEG、TIFF、GIF 和 PDF 文件。不过,还有很多其他文件类型。
是否可以通过分析包含的数据来自动识别正确的文件类型?
答案1
您可以使用特尔 ID该工具拥有一个不断增长的文件类型定义库,用于识别文件。
支持通配符,因此在您的示例中,您可以将所有要检查的图像放在一个文件夹中,例如 C:\verifyimages - 然后您可以使用以下命令:
trid C:\verifyimages\*
这将检查verifyimages
文件夹中的所有文件。
还有 GUI 版本可用,特立尼达和多巴哥共和国:
有文档介绍如何轻松地将 TrID 或 TrIDNet 集成到 Windows 资源管理器和 Total Commander:
Windows资源管理器
总指挥官
答案2
文件测试每个参数以尝试对其进行分类。有三组测试按以下顺序执行:文件系统测试、魔术数字测试和语言测试。第一的测试成功将导致文件类型被打印。
打印出来的字样通常包含以下单词之一文本(该文件仅包含打印字符和一些常见的控制字符,在 ASCII 终端上读取应该是安全的),可执行文件(该文件包含以某些 UNIX 内核或其他内核可以理解的形式编译程序的结果),或者数据表示其他任何内容(数据通常为“二进制”或不可打印)。例外情况是众所周知的文件格式(核心文件、tar 存档),这些文件格式已知包含二进制数据。
答案3
答案4
您可以从任何计算机(包括 Windows)检查文件类型