给定一个文件，找到它在子目录中被复制到的位置

Question 1

我建议你——取决于你的软件——fslint、duff、fdupes、dmerge、rmlint、rdfind——它们都能够比 fdupes 或 dupseek 更快地找到双胞胎。

我会执行：

$ find /path -type f -printf "%p - %s\n" | sort -nr -k3 | uniq -D -f1

Answer

我建议你——取决于你的软件——fslint、duff、fdupes、dmerge、rmlint、rdfind——它们都能够比 fdupes 或 dupseek 更快地找到双胞胎。

我会执行：

$ find /path -type f -printf "%p - %s\n" | sort -nr -k3 | uniq -D -f1

Question 2

myfile=/full/path/to/data.txt

mysearchpath=/my/search/path/root/directory

for file in $(find ${mysearchpath} -type f)
do
  diff ${myfile} ${file} > /dev/null 
  result=${?}
  if [ $result -eq 0 ]
  then
    echo "Identical file found at ${file}"
  fi
done

尽管这是一种非常昂贵的方法（在计算资源方面，特别是当您与其他人共享此服务器做其他事情时）。您可以创建这些文件的校验和，并且可以运行一个作业来创建在任何给定日期添加的文件的校验和，并将它们放在某个平面文件中。当您需要查找文件时，创建该文件的校验和并将其与校验和数据库进行比较。只是一些值得深思的东西。

Answer

myfile=/full/path/to/data.txt

mysearchpath=/my/search/path/root/directory

for file in $(find ${mysearchpath} -type f)
do
  diff ${myfile} ${file} > /dev/null 
  result=${?}
  if [ $result -eq 0 ]
  then
    echo "Identical file found at ${file}"
  fi
done

尽管这是一种非常昂贵的方法（在计算资源方面，特别是当您与其他人共享此服务器做其他事情时）。您可以创建这些文件的校验和，并且可以运行一个作业来创建在任何给定日期添加的文件的校验和，并将它们放在某个平面文件中。当您需要查找文件时，创建该文件的校验和并将其与校验和数据库进行比较。只是一些值得深思的东西。

Question 3

如果这是需要定期检查的内容，您可以设置一个 cron 作业来创建文件的 md5 哈希值的摘要，例如

echo > $digest_file; find $search_path -type f | xargs md5sum >> $digest_file

假设自从您的文件被复制后就已经运行了此操作，请首先找到已知文件的哈希值，然后检查列表中是否有具有相同哈希值的其他文件。当然，性能取决于搜索路径中文件的数量和大小。

这样做的另一个好处是，如果您在每次运行之前复制摘要并比较新旧摘要，则可以检测数据损坏/更改。

Answer

如果这是需要定期检查的内容，您可以设置一个 cron 作业来创建文件的 md5 哈希值的摘要，例如

echo > $digest_file; find $search_path -type f | xargs md5sum >> $digest_file

假设自从您的文件被复制后就已经运行了此操作，请首先找到已知文件的哈希值，然后检查列表中是否有具有相同哈希值的其他文件。当然，性能取决于搜索路径中文件的数量和大小。

这样做的另一个好处是，如果您在每次运行之前复制摘要并比较新旧摘要，则可以检测数据损坏/更改。

Question 4

与find和cmp：

find . -type f -exec sh -c 'cmp -s data.txt "$0" 2>/dev/null && echo $0' {} \;

您可能想要添加更多条件来限制查找。

Answer

与find和cmp：

find . -type f -exec sh -c 'cmp -s data.txt "$0" 2>/dev/null && echo $0' {} \;

您可能想要添加更多条件来限制查找。

给定一个文件，找到它在子目录中被复制到的位置

答案1

答案2

答案3

答案4

相关内容