我有一个充满FF
值的二进制文件。我在它的开头填了很多\000
。然后,我用 10 填充它的开头\000
,以获得某种偏移量,然后我写了一个更短的字符串,也以\000
我用过这个printf
:
printf \000\000\000\000\000\000\000\000\000\000MAC_ADDRESS=12:34:56:78:90,PCB_MAIN_ID=m/SF-1V/MAIN/0.0,PCB_PIGGY1_ID=n/SF-1V/PS/0.0,CSL_HW_VARIANT=D\000' > eeprom
这就是我显示文件的十六进制转储时的样子
现在我想知道如何读取该字符串。我可以使用MY_STR=${eeprom:OFFSET}
(eeprom
是文件名),它会给我字符串,但也会给我我不想要的文件的其余部分。当它第一次遇到时,我该如何阻止它\000
?
- 无法使用,
MY_STR=${eeprom:OFFSET:LENGTH}
因为字符串的长度未知 - 另一件事 - 我怎样才能再次填充它
FF
? - 使用
sh
(忙碌盒)
编辑
尝试做一些小例子...我有一个input
具有以下值的文件(在 之后xxd -c 1 input
):
0000000: 68 h
0000001: 65 e
0000002: 6c l
0000003: 6c l
0000004: 6f o
0000005: 2c ,
0000006: 20
0000007: 00 .
0000008: 69 i
0000009: 74 t
000000a: 27 '
000000b: 73 s
000000c: 20
000000d: 6d m
000000e: 65 e
000000f: 2c ,
0000010: 00 .
我有这个脚本s.sh
:
BUF=""
for c in $(xxd -p input); do
if [ "${c}" != 00 ]; then
BUF="$BUFc";
else
break;
fi
done
echo $BUF
我希望它会回显“你好”,但是没有打印任何内容
答案1
方案一:直接变量赋值
如果您担心的只是空字节,那么您应该能够使用您喜欢的标准方法直接将文件中的数据读取到变量中,即您应该能够忽略空字节并读取数据从文件中。这是使用cat
命令和命令替换的示例:
$ data="$(cat eeprom)"
$ echo "${data}"
MAC_ADDRESS=12:34:56:78:90,PCB_MAIN_ID=m/SF-1V/MAIN/0.0,PCB_PIGGY1_ID=n/SF-1V/PS/0.0,CSL_HW_VARIANT=D
这在 BusyBox Docker 容器中对我有用。
解决方案 2:使用xxd
andfor
循环
如果您想要更多的控制,可以使用xxd
将字节转换为十六进制字符串并迭代这些字符串。然后,在迭代这些字符串时,您可以应用您想要的任何逻辑,例如,您可以显式跳过初始空值并打印其余数据,直到达到某些中断条件。
下面的脚本指定有效字符(ASCII 32 到 127)的“白名单”,将其他字符的任何子序列视为分隔符,并提取所有有效子字符串:
#!/bin/sh
# get_hex_substrings.sh
# Get the path to the data-file as a command-line argument
datafile="$1"
# Keep track of state using environment variables
inside_padding_block="true"
inside_bad_block="false"
# NOTE: The '-p' flag is for "plain" output (no additional formatting)
# and the '-c 1' option specifies that the representation of each byte
# will be printed on a separate line
for h in $(xxd -p -c 1 "${datafile}"); do
# Convert the hex character to standard decimal
d="$((0x${h}))"
# Case where we're still inside the initial padding block
if [ "${inside_padding_block}" == "true" ]; then
if [ "${d}" -ge 32 ] && [ "${d}" -le 127 ]; then
inside_padding_block="false";
printf '\x'"${h}";
fi
# Case where we're passed the initial padding, but inside another
# block of non-printable characters
elif [ "${inside_bad_block}" == "true" ]; then
if [ "${d}" -ge 32 ] && [ "${d}" -le 127 ]; then
inside_bad_block="false";
printf '\x'"${h}";
fi
# Case where we're inside of a substring that we want to extract
else
if [ "${d}" -ge 32 ] && [ "${d}" -le 127 ]; then
printf '\x'"${h}";
else
inside_bad_block="true";
echo
fi
fi
done
if [ "${inside_bad_block}" == "false" ]; then
echo
fi
现在我们可以通过创建一个示例文件来测试这一点,该文件具有分隔子字符串的\x00
和\xff
子序列:
printf '\x00\x00\x00string1\xff\xff\xffstring2\x00\x00\x00string3\x00\x00\x00' > data.hex
这是运行脚本时得到的输出:
$ sh get_hex_substrings.sh data.hex
string1
string2
string3
解决方案 3:使用tr
和cut
命令
您还可以尝试使用tr
和cut
命令来处理空字节。以下是通过挤压/折叠相邻空字符并将其转换为换行符从空终止字符串列表中提取第一个空终止字符串的示例:
$ printf '\000\000\000string1\000\000\000string2\000\000\000string3\000\000\000' > file.dat
$ tr -s '\000' '\n' < file.dat | cut -d$'\n' -f2
string1