首页 > 系统 > Linux > 正文

Linux高级流量控制tc运用

2022-07-16 17:15:32
字体:
来源:转载
供稿:网友
  在做MHA测试的时候,有一个重要的环节就是测试MHA Manager节点和Master节点的网络情况,如果产生了抖动,那么MHA本身提供了一个参数secondary_check来保证,但是如果你的部署环境中是一主一从的话,这个参数就不会起作用了,因为latest slave和oldest slave是同一个库,简单来说,连不上就是连不上了,至于切还是不切,这个还不好说。我们测试的场景下,有时候切,有时候不切。所以我们原本测试的MHA0.57版本就降级为了0.56,仔细测试发现,其实也存在这样的问题,综合再三,我们就把secondary_check给取消了,直接在MHA的代码里调整了超时次数的配置(默认是4次)。
 
  接下来的问题来了,如果做更深入的测试,我们势必需要完整的模拟网络的抖动情况,这个时候传统的service network stop ; sleep xxx; service network start的方式就会受限了。潜在的一个原因就是重启服务以后,VIP就没有了。
 
  但是基本能够模拟出MHA的场景,保证在指定的时间范围内出现抖动而不会误切。
 
  所以经过全方位的测试,我们心里有底了,那些方面该怎么调整,那些细节需要继续深究,都有了一些心得和体会。
 
  但是网络的测试其实感觉还是不够彻底,毕竟真实的网络抖动不会网卡不可用,而是网络超时,丢包等等。
 
  所以如果能够尽可能模拟出网络问题,配合MHA来联调测试,就能够基本模拟出真实的问题场景了。所以tc这个方案就进入了我的视线。
 
  Linux的网络流控,控发不控收 , 所以只能对产生瓶颈网卡处的发包速率进行控制 , 流量控制过程分二种(以下内容参考自https://www.ibm.com/developerworks/cn/linux/1412_xiehy_tc/index.html)
 
  队列控制 即 QOS, 瓶颈处的发送队列的规则控制,常见的有 SFQ PRIO
  流量控制 即带宽控制 , 队列的排队整形, 一般为 TBF HTB Linux 流量控制算法分二种:
  无类算法 用于树叶级无分支的队列,例如:SFQ
  分类算法 用于多分支的队列,例如:PRIO TBF HTB
  而涉及到的流控算法SFQ和TBF都是需要简单了解的。
 
  SFQ(Stochastic Fairness Queueing 随机公平队列 ) 是公平队列算法家族中的一个简单实现 . 它的精确性不如其它的方法 , 但实现了高度的公平 , 需要的计算量亦很少 .
 
  其中SFQ 只会发生在数据发生拥堵 , 产生等待队列的网卡上,出口网卡若无等待队列 ,SFQ 也不起作用 ...
 
  令牌桶过滤器 (TBF) 是一个简单的队列规定 : 只允许以不超过事先设定的速率到来的数据包通过 , 但可能允许短暂突发流量朝过设定值 .
 
  ping的结果如下:
 
  64 bytes from 192.168.253.129: icmp_seq=278 ttl=64 time=98.3 ms
 
  64 bytes from 192.168.253.129: icmp_seq=279 ttl=64 time=99.1 ms
 
  64 bytes from 192.168.253.129: icmp_seq=280 ttl=64 time=93.4 ms
 
  64 bytes from 192.168.253.129: icmp_seq=281 ttl=64 time=95.5 ms
 
  还有几类网络情况需要考虑,比如丢包。在流量劫持的场景中,丢包率是一个需要重点关注的场景。
 
  我们可以玩得大一些,丢包率10%,那是比较严重的问题了。
 
  [root@oel642 ~]# tc qdisc add dev eth2 root netem loss 10%
 
  ping的结果如下,可以看到小结的部分,丢包率是基本在10%的基本范围内,目前是8%。

(编辑:错新网)

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表