Perl 的 -0 选项到底是如何工作的？

Question 1

八进制就像十进制一样，0 == 0、0000 == 0、0 == 000000 等。事实上，这里的开关-0可能会让事情有点混乱——我会假设关于“特殊值”的观点00”表示一个0为开关，一个为数值；添加更多的零不会改变后者，所以你会得到同样的结果......

在一定程度上。等的行为000000有点像错误，但请记住，这应该指的是单个 8 位值。 8 位的范围，十进制为 0-255，八进制为 0-377。因此，您不可能在这里使用超过 3 位数字（特殊值均超出该范围，但仍然是 3 位数字 + 开关）。您可能只是从以下内容中推断出这一点：

您还可以使用十六进制表示法指定分隔符：-0xHHH...，其中 H 是有效的十六进制数字。与八进制形式不同，这个可以用来指定任何 Unicode 字符，即使那些超出 0xFF 的值。

0xFF 十六进制 == 255 十进制 == 377 八进制 == 8 位最大值，即一个字节的大小和（扩展）ASCII 集中的一个字符。

Answer

八进制就像十进制一样，0 == 0、0000 == 0、0 == 000000 等。事实上，这里的开关-0可能会让事情有点混乱——我会假设关于“特殊值”的观点00”表示一个0为开关，一个为数值；添加更多的零不会改变后者，所以你会得到同样的结果......

在一定程度上。等的行为000000有点像错误，但请记住，这应该指的是单个 8 位值。 8 位的范围，十进制为 0-255，八进制为 0-377。因此，您不可能在这里使用超过 3 位数字（特殊值均超出该范围，但仍然是 3 位数字 + 开关）。您可能只是从以下内容中推断出这一点：

您还可以使用十六进制表示法指定分隔符：-0xHHH...，其中 H 是有效的十六进制数字。与八进制形式不同，这个可以用来指定任何 Unicode 字符，即使那些超出 0xFF 的值。

0xFF 十六进制 == 255 十进制 == 377 八进制 == 8 位最大值，即一个字节的大小和（扩展）ASCII 集中的一个字符。

Question 2

让我们查看perl源代码以了解更多详细信息。在perl.c:

case '0':
    {
     I32 flags = 0;
     STRLEN numlen;

     SvREFCNT_dec(PL_rs);
     if (s[1] == 'x' && s[2]) {
          const char *e = s+=2;
          U8 *tmps;

          while (*e)
        e++;
          numlen = e - s;
          flags = PERL_SCAN_SILENT_ILLDIGIT;
          rschar = (U32)grok_hex(s, &numlen, &flags, NULL);
          if (s + numlen < e) {
           rschar = 0; /* Grandfather -0xFOO as -0 -xFOO. */
           numlen = 0;
           s--;
          }
          PL_rs = newSVpvs("");
          SvGROW(PL_rs, (STRLEN)(UNISKIP(rschar) + 1));
          tmps = (U8*)SvPVX(PL_rs);
          uvchr_to_utf8(tmps, rschar);
          SvCUR_set(PL_rs, UNISKIP(rschar));
          SvUTF8_on(PL_rs);
     }
     else {
          numlen = 4;
          rschar = (U32)grok_oct(s, &numlen, &flags, NULL);
          if (rschar & ~((U8)~0))
           PL_rs = &PL_sv_undef;
          else if (!rschar && numlen >= 2)
           PL_rs = newSVpvs("");
          else {
           char ch = (char)rschar;
           PL_rs = newSVpvn(&ch, 1);
          }
     }
     sv_setsv(get_sv("/", GV_ADD), PL_rs);
     return s + numlen;
    }

格罗克_八月将表示八进制数的字符串转换为数字形式。如果尝试输入无效的八进制数字，它会立即返回。它只假设每 4 个字符 (numlen = 4) 为一个有效值（您可以在其实现中看到 for 循环）数字.c）

所以在中-00000，首先perl解析-0000并设置$/为\000.最后一个0被认为是perl -0，导致再次$/设置\000。您可以在以下位置看到：

$ perl -MO=Deparse -00000777ne 'print; exit' file
BEGIN { $/ = undef; $\ = undef; }
LINE: while (defined($_ = <ARGV>)) {
    print $_;
    exit;
}
-e syntax OK

$/被设置为undef，因为最后解析的八进制序列perl是0777。

更清楚：

$ perl -MO=Deparse -00000x1FF -ne 'print; exit' file
BEGIN { $/ = "\x{1ff}"; $\ = undef; }
LINE: while (defined($_ = <ARGV>)) {
    print $_;
    exit;
}
-e syntax OK

您可以看到$/已设置为最后 4 位数字序列0x1FF。

Answer