解析主机名需要 5 秒

Question 1

简短回答：

解决方法是通过添加一行来强制glibc重用套接字来查找AAAA和记录：A/etc/resolv.conf

options single-request-reopen

这个问题的真正原因可能是：

配置错误的防火墙或路由器（例如此处描述的 Juniper 防火墙配置) 导致AAAADNS 数据包丢失
DNS 服务器中的错误

长答案：

curl类似或wget使用glibc的功能的程序获取地址信息()，它尝试通过并行查找 DNS 记录来兼容 IPv4 和 IPv6。在收到两条记录之前它不会返回结果（有与这种行为相关的几个问题) - 这解释了strace上面的内容。当强制使用 IPv4 时，例如curl -4在内部仅gethostbyname()查询A记录。

从中tcpdump我们可以看出：

-> A?开头发送两个请求
-> AAAA?（请求 IPv6 地址）
<- AAAA回复
-> A?再次请求 IPv4 地址
<- A收到回复
-> AAAA?再次请求 IPv6
<- AAAA回复

A由于某种原因，一个回复被删除，这是一条错误消息：

error sending response: host unreachable

但我不清楚为什么需要第二次AAAA查询。

要验证您是否遇到相同的问题，您可以在以下位置更新超时/etc/resolv.conf：

options timeout:3

首先创建一个文本文件自定义时间报告配置:

cat >./curl-format.txt  <<-EOF
   time_namelookup: %{time_namelookup}\n
      time_connect: %{time_connect}\n
   time_appconnect: %{time_appconnect}\n
     time_redirect: %{time_redirect}\n
  time_pretransfer: %{time_pretransfer}\n
time_starttransfer: %{time_starttransfer}\n
                    ----------\n
time_total: %{time_total}\n
EOF

然后发送请求：

$ curl -w "@curl-format.txt" -o /dev/null -s https://example.com

            time_namelookup:  3.511
               time_connect:  3.511
            time_appconnect:  3.528
           time_pretransfer:  3.528
              time_redirect:  0.000
         time_starttransfer:  3.531
                            ----------
                 time_total:  3.531

还有另外两个相关选项man resolv.conf：

单一请求（自 glibc 2.10 起）设置RES_SNGLKUP 在 _res.options.默认情况下，glibc 从 2.9 版本开始并行执行 IPv4 和 IPv6 查找。某些设备 DNS 服务器无法正确处理这些查询并使请求超时。此选项禁用该行为并使 glibc 按顺序执行 IPv6 和 IPv4 请求（代价是解析过程会减慢）。

单请求重新打开（自 glibc 2.9 起） 解析器对 A 和 AAAA 请求使用相同的套接字。某些硬件错误地只发回一个回复。当这种情况发生时，客户端系统将坐下来等待第二个答复。打开此选项会更改此行为，以便如果来自同一端口的两个请求未正确处理，它将关闭套接字并在发送第二个请求之前打开一个新套接字。

相关问题：

Answer

简短回答：

解决方法是通过添加一行来强制glibc重用套接字来查找AAAA和记录：A/etc/resolv.conf

options single-request-reopen

这个问题的真正原因可能是：

配置错误的防火墙或路由器（例如此处描述的 Juniper 防火墙配置) 导致AAAADNS 数据包丢失
DNS 服务器中的错误

长答案：

curl类似或wget使用glibc的功能的程序获取地址信息()，它尝试通过并行查找 DNS 记录来兼容 IPv4 和 IPv6。在收到两条记录之前它不会返回结果（有与这种行为相关的几个问题) - 这解释了strace上面的内容。当强制使用 IPv4 时，例如curl -4在内部仅gethostbyname()查询A记录。

从中tcpdump我们可以看出：

-> A?开头发送两个请求
-> AAAA?（请求 IPv6 地址）
<- AAAA回复
-> A?再次请求 IPv4 地址
<- A收到回复
-> AAAA?再次请求 IPv6
<- AAAA回复

A由于某种原因，一个回复被删除，这是一条错误消息：

error sending response: host unreachable

但我不清楚为什么需要第二次AAAA查询。

要验证您是否遇到相同的问题，您可以在以下位置更新超时/etc/resolv.conf：

options timeout:3

首先创建一个文本文件自定义时间报告配置:

cat >./curl-format.txt  <<-EOF
   time_namelookup: %{time_namelookup}\n
      time_connect: %{time_connect}\n
   time_appconnect: %{time_appconnect}\n
     time_redirect: %{time_redirect}\n
  time_pretransfer: %{time_pretransfer}\n
time_starttransfer: %{time_starttransfer}\n
                    ----------\n
time_total: %{time_total}\n
EOF

然后发送请求：

$ curl -w "@curl-format.txt" -o /dev/null -s https://example.com

            time_namelookup:  3.511
               time_connect:  3.511
            time_appconnect:  3.528
           time_pretransfer:  3.528
              time_redirect:  0.000
         time_starttransfer:  3.531
                            ----------
                 time_total:  3.531

还有另外两个相关选项man resolv.conf：

单一请求（自 glibc 2.10 起）设置RES_SNGLKUP 在 _res.options.默认情况下，glibc 从 2.9 版本开始并行执行 IPv4 和 IPv6 查找。某些设备 DNS 服务器无法正确处理这些查询并使请求超时。此选项禁用该行为并使 glibc 按顺序执行 IPv6 和 IPv4 请求（代价是解析过程会减慢）。

单请求重新打开（自 glibc 2.9 起） 解析器对 A 和 AAAA 请求使用相同的套接字。某些硬件错误地只发回一个回复。当这种情况发生时，客户端系统将坐下来等待第二个答复。打开此选项会更改此行为，以便如果来自同一端口的两个请求未正确处理，它将关闭套接字并在发送第二个请求之前打开一个新套接字。

相关问题：

Question 2

正如@Tombart 所说，延迟是由于等待 IPv6 解析超时造成的。

另一种可能的做法是在 /etc/gai.conf 中优先考虑 IPv4

来自 /etc/gai.conf 中的注释

#   For sites which prefer IPv4 connections change the last line to
#
precedence ::ffff:0:0/96  100

更改后gai.conf，您需要重新启动任何使用 DNS 解析器库的应用程序才能使更改生效。

请注意，如果您使用没有 IPv6 连接的 BIND 服务器，我建议禁用 IPv6named并从根提示中获取 IPv6 地址。显然它仍然会尝试解析 AAAA 地址。

所以对于 BIND 配置，

在 /etc/default/bind9 中，为 IPv4 地址添加 -4：

OPTIONS="-4 -u bind"

并在中/etc/bind/db.root删除所有具有 AAAA DNS 根的行。

Answer