我想用dc
十六进制点来处理一些 16 进制数字,但我遇到了精度问题。例如,下面我乘以F423F.FD
,100
都是十六进制。预期的答案是F423FFD
,相反,它给出的是F423FFA.E1
,接近但即使在四舍五入后也不够准确。
$ dc
16 d i o F423F.FD 100 * p
F423FFA.E1
我读到这dc
是一个无限精度计算器,无论如何这都不是一个大数字。我做错了什么吗?
感谢您的回答。考虑到 的问题dc
,我硬着头皮编写了自己的解析器来解析其他基数的实数。如果有人对代码感兴趣,我可以将其发布在这里。
答案1
以十进制表示(用于dc
换算),相当于999999.98(向下舍入)×256,IE255999994.88,即十六进制的 F423FFA.E1。
因此,差异来自于dc
的舍入行为:不是计算 256 × (999999 + 253 ÷ 256)(这将得到 255999997),而是将 253 ÷ 256 向下舍入并乘以结果。
dc
是一个随意的精度计算器,这意味着它可以计算到您想要的任何精度,但您必须告诉它那是什么。默认情况下,其精度为 0,这意味着除法仅产生整数值,而乘法则使用输入中的位数。要设置精度,请使用k
(并记住精度始终以十进制数字表示,无论输入或输出基数如何):
10 k
16 d i o
F423FFD 100 / p
F423F.FD0000000
100 * p
F423FFD.000000000
(8 位数字的精度就足够了,因为这就是您需要用十进制表示 1 ÷ 256 的精度。)
答案2
请注意,仅打印原始数字就会显示它是四舍五入的:
$ dc <<<'16 d i o F423F.FD p'
F423F.FA
您可以通过添加大量尾随零以获得更高的精度来解决这个问题:
$ dc <<<'16 d i o F423F.FD000000 100 * p'
F423FFD.0000000
答案3
问题
问题在于 dc (和 bc)理解数字常量的方式。
例如,值(十六进制)0.3
(除以 1)被转换为接近于0.2
$ dc <<<"20k 16 d i o 0.3 1 / p"
.199999999999999999999999999
事实上,简单的常量0.3
也发生了变化:
$ dc <<<"20 k 16 d i o 0.3 p"
.1
看起来这很奇怪,但事实并非如此(稍后会详细介绍)。
添加更多的零可以使答案接近正确值:
$ dc <<<"20 k 16 d i o 0.30 p"
.2E
$ dc <<<"20 k 16 d i o 0.300 p"
.2FD
$ dc <<<"20 k 16 d i o 0.3000 p"
.3000
最后一个值是准确的,并且无论添加多少个零都将保持准确。
$ dc <<<"20 k 16 d i o 0.30000000 p"
.3000000
bc中也存在这个问题:
$ bc <<< "scale=20; obase=16; ibase=16; 0.3 / 1"
.19999999999999999
$ bc <<< "scale=20; obase=16; ibase=16; 0.30 / 1"
.2E147AE147AE147AE
$ bc <<< "scale=20; obase=16; ibase=16; 0.300 / 1"
.2FDF3B645A1CAC083
$ bc <<< "scale=20; obase=16; ibase=16; 0.3000 / 1"
.30000000000000000
每一位一位数?
对于浮点数来说,非常不直观的事实是所需的位数(点后)等于二进制位数(也在点后)。二进制数 0.101 正好等于十进制数 0.625。二进制数 0.0001110001(完全)等于0.1103515625
(十个十进制数字)
$ bc <<<'scale=30;obase=10;ibase=2; 0.101/1; 0.0001110001/1'; echo ".1234567890"
.625000000000000000000000000000
.110351562500000000000000000000
.1234567890
另外,对于像 2^(-10) 这样的浮点数,其二进制只有一个(设置)位:
$ bc <<<"scale=20; a=2^-10; obase=2;a; obase=10; a"
.0000000001000000000000000000000000000000000000000000000000000000000
.00097656250000000000
二进制位数.0000000001
(10) 与十进制位数.0009765625
(10) 相同。其他基数可能并非如此,但基数 10 是 dc 和 bc 中数字的内部表示,因此是我们真正需要关心的唯一基数。
数学证明在这个答案的最后。
BC规模
可以使用内置函数scale()
bc 来计算点后的位数:
$ bc <<<'obase=16;ibase=16; a=0.FD; scale(a); a; a*100'
2
.FA
FA.E1
如图所示,2 位数字不足以表示常数0.FD
。
而且,仅计算点后使用的字符数是报告(和使用)数字比例的非常错误的方法。数字的标度(以任何基数表示)应计算所需的位数。
十六进制浮点数中的二进制数字。
众所周知,每个十六进制数字使用 4 位。因此,小数点后的每个十六进制数字需要 4 个二进制数字,由于上述(奇怪?)事实,这也需要 4 个十进制数字。
因此,像这样的数字0.FD
需要 8 位十进制数字才能正确表示:
$ bc <<<'obase=10;ibase=16;a=0.FD000000; scale(a);a;a*100'
8
.98828125
253.00000000
添加零
数学很简单(对于十六进制数):
h
计算点后的十六进制数字 ( ) 的数量。- 乘以
h
4。 - 添加
h×4 - h = h × (4-1) = h × 3 = 3×h
零。
在 shell 代码中(对于 sh):
a=F423F.FD
h=${a##*.}
h=${#h}
a=$a$(printf '%0*d' $((3*h)) 0)
echo "$a"
echo "obase=16;ibase=16;$a*100" | bc
echo "20 k 16 d i o $a 100 * p" | dc
将打印(在 dc 和 bc 中都正确):
$ sh ./script
F423F.FD000000
F423FFD.0000000
F423FFD.0000000
在内部,bc(或dc)可以使所需的位数与上面计算的数字(3*h
)相匹配,以将十六进制浮点数转换为内部十进制表示形式。或者其他基数的其他函数(假设在此类其他基数中相对于基数 10(bc 和 dc 的内部),位数是有限的)。如 2 i (2,4,8,16,...) 和 5,10。
POSIX
posix 规范指出(对于 bc,dc 是基于哪个):
无论输入和输出基数如何,内部计算均应按照十进制进行,直至指定的十进制位数。
但是“……指定的十进制位数。”可以理解为“……表示数值常量所需的十进制位数”(如上所述),而不影响“十进制内部计算”
因为:
bc <<<'scale=50;obase=16;ibase=16; a=0.FD; a+1'
1.FA
bc 并没有真正使用上面设置的 50(“指定的小数位数”)。
仅当除法时才会进行转换(仍然不正确,因为它使用 2 的小数位数来读取常量,0.FD
然后再将其扩展到 50 位):
$ bc <<<'scale=50;obase=16;ibase=16; a=0.FD/1; a'
.FAE147AE147AE147AE147AE147AE147AE147AE147A
然而,这是准确的:
$ bc <<<'scale=50;obase=16;ibase=16; a=0.FD000000/1; a'
.FD0000000000000000000000000000000000000000
同样,读取数字字符串(常量)应该使用正确的位数。
数学证明
分两步:
二进制分数可以写为 a/2 n
二进制分数是 2 的负幂的有限和。
例如:
= 0.00110101101 =
= 0. 0 0 1 1 0 1 0 1 1 0 1
= 0 + 0×2 -1 + 0×2 -2 + 1×2 -3 + 1 ×2 -4 + 0×2 -5 + 1×2 -6 + 0×2 -7 + 1×2 -8 + 1×2 -9 + 0×2 -10 + 1×2 -11
= 2 -3 + 2 -4 + 2 -6 + 2 -8 + 2 -9 + 2 -11 =(删除零)
在 n 位的二进制分数中,最后一位的值为 2 -n或 1/2 n。在此示例中: 2 -11或 1/2 11。
= 1/2 3 + 1/2 4 + 1/2 6 + 1/2 8 + 1/2 9 + 1/2 11 =(有逆)
一般来说,分母可以变为 2 n,分子指数为 2。然后可以将所有项组合成单个值 a/2 n。对于这个例子:
= 2 8 /2 11 + 2 7 /2 11 + 2 5 /2 11 + 2 3 /2 11 + 2 2 /2 11 + 1/2 11 = (用 2 11 表示)
= (2 8 + 2 7 + 2 5 + 2 3 + 2 2 + 1 ) / 2 11 = (提取公因数)
= (256 + 128 + 32 + 8 + 4 + 1) / 2 11 = (转换为值)
= 429 / 2 11
每个二元分数都可以表示为 b/10 n
将 a/2 n乘以 5 n /5 n,得到 (a×5 n )/(2 n ×5 n ) = (a×5 n )/10 n = b/10 n,其中 b = a×5 n。它有n位数字。
例如,我们有:
(429·5 11 )/10 11 = 20947265625 / 10 11 = 0.20947265625
已经证明,每个二进制小数都是具有相同位数的十进制小数。