gitbook/趣谈网络协议/docs/10994.md
2022-09-03 22:05:03 +08:00

9.6 KiB
Raw Permalink Blame History

第27讲 | 云中的网络QoS邻居疯狂下电影我该怎么办

在小区里面,是不是经常有住户不自觉就霸占公共通道,如果你找他理论,他的话就像一个相声《楼道曲》说的一样:“公用公用,你用我用,大家都用,我为什么不能用?”。

除此之外你租房子的时候有没有碰到这样的情况本来合租共享WiFi一个人狂下小电影从而你网都上不去是不是很懊恼

在云平台上,也有这种现象,好在有一种流量控制的技术,可以实现QoSQuality of Service从而保障大多数用户的服务质量。

对于控制一台机器的网络的QoS分两个方向一个是入方向一个是出方向。

其实我们能控制的只有出方向通过Shaping将出的流量控制成自己想要的模样。而进入的方向是无法控制的只能通过Policy将包丢弃。

控制网络的QoS有哪些方式

在Linux下可以通过TC控制网络的QoS主要就是通过队列的方式。

无类别排队规则

第一大类称为无类别排队规则Classless Queuing Disciplines。还记得我们讲ip addr的时候讲过的pfifo_fast,这是一种不把网络包分类的技术。

pfifo_fast分为三个先入先出的队列称为三个Band。根据网络包里面TOS看这个包到底应该进入哪个队列。TOS总共四位每一位表示的意思不同总共十六种类型。

通过命令行tc qdisc show dev eth0可以输出结果priomap也是十六个数字。在0到2之间和TOS的十六种类型对应起来表示不同的TOS对应的不同的队列。其中Band 0优先级最高发送完毕后才轮到Band 1发送最后才是Band 2。

另外一种无类别队列规则叫作随机公平队列Stochastic Fair Queuing

会建立很多的FIFO的队列TCP Session会计算hash值通过hash值分配到某个队列。在队列的另一端网络包会通过轮询策略从各个队列中取出发送。这样不会有一个Session占据所有的流量。

当然如果两个Session的hash是一样的会共享一个队列也有可能互相影响。hash函数会经常改变从而session不会总是相互影响。

还有一种无类别队列规则称为令牌桶规则TBFToken Bucket Filte

所有的网络包排成队列进行发送,但不是到了队头就能发送,而是需要拿到令牌才能发送。

令牌根据设定的速度生成,所以即便队列很长,也是按照一定的速度进行发送的。

当没有包在队列中的时候,令牌还是以既定的速度生成,但是不是无限累积的,而是放满了桶为止。设置桶的大小为了避免下面的情况:当长时间没有网络包发送的时候,积累了大量的令牌,突然来了大量的网络包,每个都能得到令牌,造成瞬间流量大增。

基于类别的队列规则

另外一大类是基于类别的队列规则Classful Queuing Disciplines其中典型的为分层令牌桶规则HTB Hierarchical Token Bucket

HTB往往是一棵树接下来我举个具体的例子通过TC如何构建一棵HTB树来带你理解。

使用TC可以为某个网卡eth0创建一个HTB的队列规则需要付给它一个句柄为1:)。

这是整棵树的根节点,接下来会有分支。例如图中有三个分支,句柄分别为(:10:11:12。最后的参数default 12表示默认发送给1:12也即发送给第三个分支。

tc qdisc add dev eth0 root handle 1: htb default 12

对于这个网卡,需要规定发送的速度。一般有两个速度可以配置,一个是rate,表示一般情况下的速度;一个是ceil表示最高情况下的速度。对于根节点来讲这两个速度是一样的于是创建一个root class速度为rate=100kbpsceil=100kbps

tc class add dev eth0 parent 1: classid 1:1 htb rate 100kbps ceil 100kbps

接下来要创建分支也即创建几个子class。每个子class统一有两个速度。三个分支分别为rate=30kbpsceil=100kbpsrate=10kbpsceil=100kbpsrate=60kbpsceil=100kbps

tc class add dev eth0 parent 1:1 classid 1:10 htb rate 30kbps ceil 100kbps
tc class add dev eth0 parent 1:1 classid 1:11 htb rate 10kbps ceil 100kbps
tc class add dev eth0 parent 1:1 classid 1:12 htb rate 60kbps ceil 100kbps

你会发现三个rate加起来是整个网卡允许的最大速度。

HTB有个很好的特性同一个root class下的子类可以相互借流量如果不直接在队列规则下面创建一个root class而是直接创建三个class它们之间是不能相互借流量的。借流量的策略可以使得当前不使用这个分支的流量的时候可以借给另一个分支从而不浪费带宽使带宽发挥最大的作用。

最后,创建叶子队列规则,分别为fifosfq

tc qdisc add dev eth0 parent 1:10 handle 20: pfifo limit 5
tc qdisc add dev eth0 parent 1:11 handle 30: pfifo limit 5
tc qdisc add dev eth0 parent 1:12 handle 40: sfq perturb 10

基于这个队列规则我们还可以通过TC设定发送规则从1.2.3.4来的发送给port 80的包从第一个分支1:10走其他从1.2.3.4发送来的包从第二个分支1:11走其他的走默认分支。

tc filter add dev eth0 protocol ip parent 1:0 prio 1 u32 match ip src 1.2.3.4 match ip dport 80 0xffff flowid 1:10
tc filter add dev eth0 protocol ip parent 1:0 prio 1 u32 match ip src 1.2.3.4 flowid 1:11

如何控制QoS

我们讲过使用OpenvSwitch将云中的网卡连通在一起那如何控制QoS呢

就像我们上面说的一样OpenvSwitch支持两种

  • 对于进入的流量可以设置策略Ingress policy
ovs-vsctl set Interface tap0 ingress_policing_rate=100000
ovs-vsctl set Interface tap0 ingress_policing_burst=10000

  • 对于发出的流量可以设置QoS规则Egress shaping支持HTB。

我们构建一个拓扑图来看看OpenvSwitch的QoS是如何工作的。

首先在port上可以创建QoS规则一个QoS规则可以有多个队列Queue。

ovs-vsctl set port first_br qos=@newqos -- --id=@newqos create qos type=linux-htb other-config:max-rate=10000000 queues=0=@q0,1=@q1,2=@q2 -- --id=@q0 create queue other-config:min-rate=3000000 other-config:max-rate=10000000 -- --id=@q1 create queue other-config:min-rate=1000000 other-config:max-rate=10000000 -- --id=@q2 create queue other-config:min-rate=6000000 other-config:max-rate=10000000

上面的命令创建了一个QoS规则对应三个Queue。min-rate就是上面的ratemax-rate就是上面的ceil。通过交换机的网络包要通过流表规则匹配后进入不同的队列。然后我们就可以添加流表规则Flow(first_br是br0上的port 5)。

ovs-ofctl add-flow br0 "in_port=6 nw_src=192.168.100.100 actions=enqueue:5:0"
ovs-ofctl add-flow br0 "in_port=7 nw_src=192.168.100.101 actions=enqueue:5:1"
ovs-ofctl add-flow br0 "in_port=8 nw_src=192.168.100.102 actions=enqueue:5:2"

接下来我们单独测试从192.168.100.100192.168.100.101192.168.100.102到192.168.100.103的带宽的时候,每个都是能够打满带宽的。

如果三个一起测试一起狂发网络包会发现是按照3:1:6的比例进行的正是根据配置的队列的带宽比例分配的。

如果192.168.100.100和192.168.100.101一起测试发现带宽占用比例为3:1但是占满了总的流量也即没有发包的192.168.100.102有60%的带宽被借用了。

如果192.168.100.100和192.168.100.102一起测试发现带宽占用比例为1:2。如果192.168.100.101和192.168.100.102一起测试发现带宽占用比例为1:6。

小结

好了,这一节就讲到这里了,我们来总结一下。

  • 云中的流量控制主要通过队列进行的,队列分为两大类:无类别队列规则和基于类别的队列规则。

  • 在云中网络Openvswitch中主要使用的是分层令牌桶规则HTB将总的带宽在一棵树上按照配置的比例进行分配并且在一个分支不用的时候可以借给另外的分支从而增强带宽利用率。

最后,给你留两个思考题。

  1. 这一节中提到,入口流量其实没有办法控制,出口流量是可以很好控制的,你能想出一个控制云中的虚拟机的入口流量的方式吗?

  2. 安全性和流量控制大概解决了,但是不同用户在物理网络的隔离还是没有解决,你知道怎么解决吗?

我们的专栏更新到第27讲不知你掌握得如何每节课后我留的思考题你都有没有认真思考并在留言区写下答案呢我会从已发布的文章中选出一批认真留言的同学,赠送学习奖励礼券和我整理的独家网络协议知识图谱。

欢迎你留言和我讨论。趣谈网络协议,我们下期见!