我的一位朋友使用rm -rf
命令意外地从文件服务器中删除了所有文件(jpg 和 pdf)。有没有办法用实际文件名恢复这些文件?
关键点 -
- 没有用于恢复的备份
- 分区格式为ext4
我们尝试了以下解决方案。
testdisk
- 仅恢复了几个文件(使用实际文件名)photorec
- 恢复了大量带有无用 .txt 文件的文件(没有实际的文件名)- 最重要的是 - 恢复没有文件名的 pdf 和 jpg
答案1
如果您恢复了一些没有文件名的有效 jpg 和 pdf 文件,您也许能够在某种程度上识别它们。
对于包含文本(不仅仅是扫描件)的 PDF,您可以通过以下方式取回部分文本:
$ pdftotext /home/paul/Downloads/Canalside/CAR*.pdf - > SomePDF.txt
$ wc SomePDF.txt
85 406 2535 SomePDF.txt
$ head -n 4 SomePDF.txt
Wiltshire Council
User
Authority Address
Contact Name
$
如果它们具有某种一致的格式,您可以解析标题或页脚的文本。您甚至可能会找到扫描图像的 OCR 选项。
对于 .jpg 文件,该file
命令输出一个datetime
值,该值至少是一个唯一的名称,并为您提供一个序列和一个可能的标识(也许您保留一个日历或时间表来关联)。
$ file /media/paul/Windows/30_Photos/PhotoStore/A810_Folders/119_1402/IMG_1280.JPG
/media/paul/Windows/30_Photos/PhotoStore/A810_Folders/119_1402/IMG_1280.JPG: JPEG image data, Exif standard: [TIFF image data, little-endian, direntries=10, description= , manufacturer=Canon, model=Canon PowerShot A810, orientation=upper-left, xresolution=194, yresolution=202, resolutionunit=2, datetime=2013:02:14 10:49:18], baseline, precision 8, 4608x3456, frames 3
$