为什么带重音符号的大写字母在 QRCODE 中无法很好解码？

Question

正如我在评论中提到的，QR 码不直接支持 Unicode。并且包的实现qrcode使用以下几行将字符转换为数字：

\def\qr@encode@ascii@recursive(#1,#2#3){%
  % #1 = hex codes translated so far
  % #2 = next plaintext character to translate
  % #3 = remainder of plaintext
  \edef\qr@testii{#2}%
  \ifx\qr@testii\qr@relax%
    % All done!
    \g@addto@macro\qr@codetext{#1}%
  \else%
    % Another character to translate.
    \edef\qr@asciicode{\number`#2}%
    \qr@decimaltohex[2]{\qr@newhexcodes}{\qr@asciicode}%
    \edef\qr@argument{(#1\qr@newhexcodes,#3)}%
    %\show\qr@argument
    \xa\qr@encode@ascii@recursive\qr@argument%
  \fi%
}%

正如您所看到的，\number`#2这是一个宏，

发送A至41
发送É至c9
发送Ù至d9
发送Ç至c7
等等...

效果`qrcode`好吗？

几乎可以。这些字符被转换成相应的数字，从而产生良好的二维码图像。

例如，原始数据ÙÇ是

40 2d 9c 70 ec 11 ec 11   ec

在哪里

4方法字节编码（每个字符 8 位）；
02表示有三个字符；
d9是Ù；并且
c7是Ç。

如果是Ù Ç，原始数据是

40 3d 92 0c 70 ec 11 ec   11

在哪里

4方法字节编码（每个字符 8 位）；
03表示有两个字符；
d9是Ù;
20是空间；并且
c7是Ç。

那么，出了什么问题？

解码时，事情变得复杂起来。结果发现，解码器识别d920c7= ，Ù Ç但不能识别d9c7= ÙÇ。我无法解释这一点。最后一种情况更有趣：

41 2e 0f 9e 9e 8e 7e f2   0c 02 0c 92 0d 92 0c 72   0c 82 0c f0 ec 11

第一个可识别的字符e0f9是瓊Shift JIS，这是 QR 码支持的编码。因此解码器将转换为 Shift JIS 并输出瓊鳧鉐ﾀﾉﾙﾇﾈﾏ结果。

但为什么`ÀÉ`表现得好？

不，不是。原始数据是

40 24 1c 90 ec 11 ec 11   ec

但事实AÉ并非如此ÀÉ。

如何解决？

首先，如果你要对法语进行编码，那么像Œ，œ以及非常罕见的Ÿ可能会导致失败。您可能需要重写上面提到的宏。

否则，如果您对 ASCII 感到满意，则需要强制解码器读取 0xFF=127 之后的字符。这与 TeX 无关。

Answer 1

正如我在评论中提到的，QR 码不直接支持 Unicode。并且包的实现qrcode使用以下几行将字符转换为数字：

\def\qr@encode@ascii@recursive(#1,#2#3){%
  % #1 = hex codes translated so far
  % #2 = next plaintext character to translate
  % #3 = remainder of plaintext
  \edef\qr@testii{#2}%
  \ifx\qr@testii\qr@relax%
    % All done!
    \g@addto@macro\qr@codetext{#1}%
  \else%
    % Another character to translate.
    \edef\qr@asciicode{\number`#2}%
    \qr@decimaltohex[2]{\qr@newhexcodes}{\qr@asciicode}%
    \edef\qr@argument{(#1\qr@newhexcodes,#3)}%
    %\show\qr@argument
    \xa\qr@encode@ascii@recursive\qr@argument%
  \fi%
}%

正如您所看到的，\number`#2这是一个宏，

发送A至41
发送É至c9
发送Ù至d9
发送Ç至c7
等等...

效果`qrcode`好吗？

几乎可以。这些字符被转换成相应的数字，从而产生良好的二维码图像。

例如，原始数据ÙÇ是

40 2d 9c 70 ec 11 ec 11   ec

在哪里

4方法字节编码（每个字符 8 位）；
02表示有三个字符；
d9是Ù；并且
c7是Ç。

如果是Ù Ç，原始数据是

40 3d 92 0c 70 ec 11 ec   11

在哪里

4方法字节编码（每个字符 8 位）；
03表示有两个字符；
d9是Ù;
20是空间；并且
c7是Ç。

那么，出了什么问题？

解码时，事情变得复杂起来。结果发现，解码器识别d920c7= ，Ù Ç但不能识别d9c7= ÙÇ。我无法解释这一点。最后一种情况更有趣：

41 2e 0f 9e 9e 8e 7e f2   0c 02 0c 92 0d 92 0c 72   0c 82 0c f0 ec 11

第一个可识别的字符e0f9是瓊Shift JIS，这是 QR 码支持的编码。因此解码器将转换为 Shift JIS 并输出瓊鳧鉐ﾀﾉﾙﾇﾈﾏ结果。

但为什么`ÀÉ`表现得好？

不，不是。原始数据是

40 24 1c 90 ec 11 ec 11   ec

但事实AÉ并非如此ÀÉ。

如何解决？

首先，如果你要对法语进行编码，那么像Œ，œ以及非常罕见的Ÿ可能会导致失败。您可能需要重写上面提到的宏。

否则，如果您对 ASCII 感到满意，则需要强制解码器读取 0xFF=127 之后的字符。这与 TeX 无关。

为什么带重音符号的大写字母在 QRCODE 中无法很好解码？

答案1

效果`qrcode`好吗？

那么，出了什么问题？

但为什么`ÀÉ`表现得好？

如何解决？

相关内容

答案1

效果qrcode好吗？

那么，出了什么问题？

但为什么ÀÉ表现得好？

如何解决？

相关内容

效果`qrcode`好吗？

但为什么`ÀÉ`表现得好？