tun 设备上的流量整形无效

Question

因此，在阅读和翻阅内核源代码之后，qdisc 似乎无效，因为 tun 驱动程序不会告诉网络堆栈它正忙。它只是将数据包保存在自己的本地队列中（其大小由 txqlen 设置），当队列已满时，它只是丢弃多余的数据包。

以下是 drivers/net/tun.c 中传输函数的相关位，当堆栈想要发送数据包时，将调用该函数：

/* Net device start xmit */
static netdev_tx_t tun_net_xmit(struct sk_buff *skb, struct net_device *dev)
{
    struct tun_struct *tun = netdev_priv(dev);
    int txq = skb->queue_mapping;
    struct tun_file *tfile;
    int len = skb->len;

    rcu_read_lock();
    tfile = rcu_dereference(tun->tfiles[txq]);

....... Various unrelated things omitted .......

    if (ptr_ring_produce(&tfile->tx_ring, skb))
        goto drop;

    /* Notify and wake up reader process */
    if (tfile->flags & TUN_FASYNC)
        kill_fasync(&tfile->fasync, SIGIO, POLL_IN);
    tfile->socket.sk->sk_data_ready(tfile->socket.sk);

    rcu_read_unlock();
    return NETDEV_TX_OK;

    drop:
        this_cpu_inc(tun->pcpu_stats->tx_dropped);
        skb_tx_error(skb);
        kfree_skb(skb);
        rcu_read_unlock();
        return NET_XMIT_DROP;
    }
}

典型的网络接口驱动程序应调用 netif_stop_queue() 和 netif_wake_queue() 函数来停止和启动来自网络堆栈的数据包流。当流量停止时，数据包将按照附加的队列规则进行排队，从而使用户能够更灵活地管理流量和确定优先级。

无论出于何种原因，tap/tun 驱动程序都不会执行此操作 - 可能是因为大多数隧道只是简单地封装数据包并将其发送到真实的网络接口，而无需任何额外的流量控制。

为了验证我的发现，我通过停止上面函数中的流量控制尝试了一个简单的测试：

    if (ptr_ring_produce(&tfile->tx_ring, skb)) {
            netif_stop_queue(dev);
            goto drop;
    } else if (ptr_ring_full(&tfile->tx_ring)) {
            netif_stop_queue(dev);
            tun_debug(KERN_NOTICE, tun, "tun_net_xmit stop %lx\n", (size_t)skb);
    }

并对 tun_ring_recv 进行了类似的添加，以根据数据包出队后队列是否为空来停止/唤醒队列：

    empty = __ptr_ring_empty(&tfile->tx_ring);
    if (empty)
            netif_wake_queue(tun->dev);
    else
            netif_stop_queue(tun->dev);

这不是一个很好的系统，并且不能与多队列隧道一起使用，但它工作得足够好，我可以看到 qdisc 报告积压，并且当链接时在不同 ToS 级别使用 pfifo_fast 的 ping 时间和丢失率有明显差异已满负荷。

Answer 1