Grep，但适用于二进制文件

Question 1

我会做什么：

grep -a -r -l -F <fixed string> .

-a, --text
处理二进制文件，就像它是文本一样；这相当于 --binary-files=text 选项。

或者

find . -type f -exec sh -c '
    strings "$1" | grep -lF <fixed pattern>
' sh {} \;

strings - 打印文件中可打印字符的序列

Answer

我会做什么：

grep -a -r -l -F <fixed string> .

-a, --text
处理二进制文件，就像它是文本一样；这相当于 --binary-files=text 选项。

或者

find . -type f -exec sh -c '
    strings "$1" | grep -lF <fixed pattern>
' sh {} \;

strings - 打印文件中可打印字符的序列

Question 2

你可以首先使用转储二进制文件OD:

我建议使用 -x 和 -w256 选项来减少文件大小和行数，以最大限度地提高 grep 效率，并且必须使用 -A n 选项来删除不必要的偏移地址，让我们：

od -x -A n -w256 yourbinary_fragment > pattern.txt

您还可以积极使用 -j -N 和 -w 选项，甚至重新编辑pattern.txt，以将行数减少到严格的最低限度。（为了显着减轻grep的工作）

然后查找与模式匹配的文件自己被抛弃后

find . -type f -exec sh -c '
    od -x -A n -w256 "$1" | grep -lFf pattern.txt
' sh {} \;

如果将您的计算机用于其他目的，我建议对该进程进行 SCHED_BATCH。

Answer

你可以首先使用转储二进制文件OD:

我建议使用 -x 和 -w256 选项来减少文件大小和行数，以最大限度地提高 grep 效率，并且必须使用 -A n 选项来删除不必要的偏移地址，让我们：

od -x -A n -w256 yourbinary_fragment > pattern.txt

您还可以积极使用 -j -N 和 -w 选项，甚至重新编辑pattern.txt，以将行数减少到严格的最低限度。（为了显着减轻grep的工作）

然后查找与模式匹配的文件自己被抛弃后

find . -type f -exec sh -c '
    od -x -A n -w256 "$1" | grep -lFf pattern.txt
' sh {} \;

如果将您的计算机用于其他目的，我建议对该进程进行 SCHED_BATCH。

Question 3

使用perlSys::Mmap 模块（在libsys-mmap-perlDebian 上的包中）：

fragment=/path/to/your/fragment
size=$(( $(wc -c < "$fragment") - 1 ))
find . -type f -size "+${size}c" -print0 | 
  perl -MSys::Mmap -l -0sne '
    BEGIN {
      open N, "<", $needle or die "$ARGV[0]: $!\n";
      mmap($n, 0, PROT_READ, MAP_SHARED, N);
    }
    if (open H, "<", $_) {
      mmap($h, 0, PROT_READ, MAP_SHARED, H);
      print if index($h, $n) >=0;
    } else {
      warn "$_: $!\n";
    }' -- -needle="$fragment"

Answer

使用perlSys::Mmap 模块（在libsys-mmap-perlDebian 上的包中）：

fragment=/path/to/your/fragment
size=$(( $(wc -c < "$fragment") - 1 ))
find . -type f -size "+${size}c" -print0 | 
  perl -MSys::Mmap -l -0sne '
    BEGIN {
      open N, "<", $needle or die "$ARGV[0]: $!\n";
      mmap($n, 0, PROT_READ, MAP_SHARED, N);
    }
    if (open H, "<", $_) {
      mmap($h, 0, PROT_READ, MAP_SHARED, H);
      print if index($h, $n) >=0;
    } else {
      warn "$_: $!\n";
    }' -- -needle="$fragment"

Question 4

如果您怀疑一个文件是另一个文件的第一部分，您可以从两个文件中获取前几个字节并进行比较：

# Omit or change the bytes arguments as needed, see `man head`
head --bytes=1032 file1.bin > /tmp/file1.head.bin
head --bytes=1032 file2.bin > /tmp/file2.head.bin
diff --text /tmp/file.head.*

您还可以使用直观地查看文件xxd /tmp/fil1.head.bin。最后，像 Meld 或 Beyond Compare 这样的程序可以向您展示文件的视觉并排比较。

Answer

如果您怀疑一个文件是另一个文件的第一部分，您可以从两个文件中获取前几个字节并进行比较：

# Omit or change the bytes arguments as needed, see `man head`
head --bytes=1032 file1.bin > /tmp/file1.head.bin
head --bytes=1032 file2.bin > /tmp/file2.head.bin
diff --text /tmp/file.head.*

您还可以使用直观地查看文件xxd /tmp/fil1.head.bin。最后，像 Meld 或 Beyond Compare 这样的程序可以向您展示文件的视觉并排比较。

Grep，但适用于二进制文件

答案1

答案2

答案3

答案4

相关内容