如何校验和并验证文件系统上的所有文件

Question 1

这些工具或多或少适用于以下用例：

http://md5deep.sourceforge.net/

Answer

这些工具或多或少适用于以下用例：

http://md5deep.sourceforge.net/

Question 2

或者你可以自己写点东西；）我用 Python 编写了这个脚本，合并了网络上其他人的片段。它可以作为一个起点。

/usr/bin/python 的 #!

导入操作系统
导入 hashlib
从 joblib 导入并行、延迟
导入 json

BASE_DIR = “/home/p/music”
进程数 = 2
OUT_FILE =“哈希.json”

# 要处理的文件列表
文件列表 = []
对于 os.walk(BASE_DIR) 中的 root、dir、files：
    对于文件中的名称：
        file_list.append(os.path.join(root，name))


#——对单个文件进行md5sum计算
定义 hashOne（f）：
    块大小 = 65536
    hasher = hashlib.md5()
    使用 open(f，'rb') 作为文件：
        打印 f
        buf = afile.read(块大小)
        当 len(buf) > 0 时：
            hasher.update（buf）
            buf = afile.read(块大小)
    返回 hasher.hexdigest()

# 并行计算md5sum    
md5 = Parallel（n_jobs=NUM_PROC）（file_list 中的 f 的延迟（hashOne）（f））

# 对 file_names -> md5sum 进行哈希处理
输出哈希值 = {}
对于范围内的 i (len (file_list))：
    out_hash[文件列表[i]] = md5[i]

# 将哈希“文件名 -> md5sum”写入磁盘以供将来使用
转储 = json.dumps（out_hash）
使用打开（OUT_FILE，“wb”）作为文件：
    文件.写入（转储）

Answer

或者你可以自己写点东西；）我用 Python 编写了这个脚本，合并了网络上其他人的片段。它可以作为一个起点。

/usr/bin/python 的 #!

导入操作系统
导入 hashlib
从 joblib 导入并行、延迟
导入 json

BASE_DIR = “/home/p/music”
进程数 = 2
OUT_FILE =“哈希.json”

# 要处理的文件列表
文件列表 = []
对于 os.walk(BASE_DIR) 中的 root、dir、files：
    对于文件中的名称：
        file_list.append(os.path.join(root，name))


#——对单个文件进行md5sum计算
定义 hashOne（f）：
    块大小 = 65536
    hasher = hashlib.md5()
    使用 open(f，'rb') 作为文件：
        打印 f
        buf = afile.read(块大小)
        当 len(buf) > 0 时：
            hasher.update（buf）
            buf = afile.read(块大小)
    返回 hasher.hexdigest()

# 并行计算md5sum    
md5 = Parallel（n_jobs=NUM_PROC）（file_list 中的 f 的延迟（hashOne）（f））

# 对 file_names -> md5sum 进行哈希处理
输出哈希值 = {}
对于范围内的 i (len (file_list))：
    out_hash[文件列表[i]] = md5[i]

# 将哈希“文件名 -> md5sum”写入磁盘以供将来使用
转储 = json.dumps（out_hash）
使用打开（OUT_FILE，“wb”）作为文件：
    文件.写入（转储）

如何校验和并验证文件系统上的所有文件

答案1

答案2

相关内容