删除所有以特定标题开头的文件

删除所有以特定标题开头的文件

所以我有一个想要用于神经网络的数据集。

问题是,在数据集中,有些文件原本是 .BMP,但由于我使用了脚本,它们被转换为 .JPG

我正在尝试弄清楚如何自动删除这些文件,因为我正在处理大量数据,并且手动执行是不可能的。

在文件资源管理器中发现它们非常容易(缩略图不会加载,只是显示 JPG),但我无法找到一种自动化的方法来做到这一点。

请帮忙。

答案1

您可以使用 ImageMagick 的“identify”命令来区分位图文件。剩下的应该是一个或多或少简单的脚本练习,检查您的文件并删除正确的文件 - 或者将它们移动到一个单独的目录中,您可以在删除之前检查它们,以确保只删除您想要删除的文件。

https://www.imagemagick.org

ImageMagick 跨平台性很强,网上有详尽的文档。以下是示例输出(来自 Ubuntu 内部):

anlag@jansson:~/Downloads/img$ identify lena_gray.bmp 
lena_gray.bmp BMP3 512x512 512x512+0+0 8-bit sRGB 256c 263KB 0.000u 0:00.000
anlag@jansson:~/Downloads/img$ identify photo.jpg 
photo.jpg JPEG 127x127 127x127+0+0 8-bit sRGB 7.51KB 0.000u 0:00.000

您将解析输出中的“BMP3”字符串并进行相应的处理。脚本本身可以使用您熟悉的任何工具完成:Windows cmd.exe 脚本、Python、bash 等。如果您也需要这部分帮助,最好指定有关您使用的操作系统和软件(特别是脚本语言/工具)的更多信息。

PS:我引用了 ImageMagick,因为它是跨平台的,但如果您碰巧使用的是 Linux,那么“文件”命令将为这种用例提供​​等效信息。

anlag@jansson:~/Downloads/img$ file lena_gray.bmp 
lena_gray.bmp: PC bitmap, Windows 3.x format, 512 x 512 x 8
anlag@jansson:~/Downloads/img$ file photo.jpg 
photo.jpg: JPEG image data, JFIF standard 1.01, resolution ...

相关内容