od
(八进制转储)命令从版本 1 开始在 Unix 中实现。但是,我在版本 6 Unix 手册(1975)。现代方式od
用xxd
或进行逆向操作sed
不适用于 Unix V6,因为sed
和awk
只出现在版本 7 中(而uudecode
、xxd
和base64
也不可用)。
问题是:
- 1975 年的人们如何将八进制或十六进制列表转换为二进制文件?
- 如何在仅允许我将文本从剪贴板粘贴到终端的 PDP-11 模拟器中执行此操作? (换句话说,是否有必要为此编写自己的程序?)
这是二进制文件的十六进制转储示例,od
我想将其转换回二进制文件:
# od -h /bin/sum
0000000 0107 00ba 0000 0204 0000 0000 0000 0001
0000020 1583 0bd6 0ac3 0601 8901 0a37 00ae 15b7
0000040 0002 8905 0000 0000 8609 15c0 0001 8904
0000060 0026 0005 01ef 706f 6472 000a 1001 0a05
0000100 1040 8903 00be 0200 870b 0bc0 030e 0ab7
0000120 007a 15c2 00be 9484 6105 0b45 7e04 01f0
0000140 15c0 0001 8904 0080 0002 09f7 0026 15c0
0000160 0001 8904 0083 0001 1dc5 0050 09f7 0014
0000200 15c0 0001 8904 0082 0001 1040 8906 01c2
0000220 203f 200a 1026 1066 1141 09f7 0006 1581
0000240 1580 0087 0a00 7217 000a 1066 1001 0302
0000260 09f7 fff0 15b7 0012 65f7 0030 000c 15c0
0000300 0001 8904 00ba 0001 0087
0000312
答案1
看起来 Unix 版本 6 并没有包含许多仅在版本 7 中出现的常用工具(例如sed
和awk
)。那时,Unix 还没有商业化,因此“反向十六进制转储”可能会丢失,仅仅是因为对该操作没有广泛的需求,或者因为 Ken(或其他一些程序员)从/usr
贝尔实验室的非官方目录中提供了此类工具。谁知道。
但这里是我在 Unix V6 上反转十六进制转储的实现。当像 一样编译时cc -s -O unhex.c
,生成的可执行文件只有 1160 字节,并且比转储运行得更快(如预期)。
请注意,当时的 C 语言仍然具有 B 的复合赋值语法(=+
,,=*
等等),以及它如何期望程序员为文件 I/O 提供自己的缓冲区。
/* reverse "od -h" operation on Unix V6 */
/* written in pre-K&R C */
/* derived from wc.c and cvopt.c */
int ibuf[259];
int obuf[259];
main(argc,argv)
char **argv;
{
int token, bytecnt;
register char *p1, *p2; /* input buffer pointers */
register int c; /* char or read count */
char sp, b1, b2, lastc, lastb2, nfirst;
obuf[0] = 1; /* standard output by default */
if (argc>2) {
/* create output file */
if ((obuf[0] = creat(argv[2], 0666)) < 0) {
diag(argv[2]);
diag(": failed to create\n");
return;
}
}
if (argc>1 && fopen(argv[1], ibuf)>=0) {
p1 = 0;
p2 = 0;
sp = 0;
token = 0;
bytecnt = 0;
nfirst = 0;
for(;;) {
/* reading from file */
if (p1 >= p2) {
p1 = &ibuf[1];
c = read(ibuf[0], p1, 512);
if (c <= 0)
break;
p2 = p1+c;
}
/* decoding loop */
c = 0;
c =| *p1++;
if (c==' ' || c=='\n') {
b1 = token;
b2 = token >> 8;
if (lastc!=' ' && lastc!='\n') {
/* end of token */
if (sp>0) {
if (nfirst) putc(lastb2, obuf);
putc(b1, obuf);
lastb2 = b2;
nfirst = 1;
} else {
/* first token in the line */
bytecnt = token;
}
}
if (c==' ') sp++;
else {
/* new line */
sp = 0;
fflush(obuf);
}
token = 0;
} else {
/* actual hex and octal conversion */
token =* sp>0 ? 16 : 8;
token =+ c<='9' ? c-'0' : c-'W';
}
lastc = c;
}
if (!(bytecnt & 1)) {
putc(lastb2, obuf);
fflush(obuf);
}
close(ibuf[0]);
close(obuf[0]);
} else if (argc>1) {
diag(argv[1]);
diag(": cannot open\n");
} else {
diag("error: filename missing\n");
}
}
diag(s)
char *s;
{
while(*s)
write(2,s++,1);
}
UPD。我发布了一个更快更简单的版本GitHub,其中语法也被突出显示。
答案2
这是一个您可以尝试在 V6 Unix 中编译的最小 C 程序。
#define EOF (-1)
int main(){
int i,a,b;
while(scanf("%*7o") != EOF){
for(i = 0; i<8; i++)
if(scanf("%2x%2x",&a,&b) != EOF){putchar(a); putchar(b);}
}
}
如果结果最终进行了字节交换,您可能需要反转 2 个 putchar。