VirMach东京爆炸的原因分析
近期看到VirMach炸成了这个样子:
是不是感觉很熟悉?没错,第一反应就是ARP收包收爆了。
和坛友 @喜洋洋 聊天时让他帮忙测了下东京VPS每秒收包数量,感谢提供测试数据:
可以看到每秒收包数量达到了1000个左右,计算下:
如果一台母鸡有200个VPS,网卡每秒就要处理20万个包,CPU早就给软中断占满了,必然会出现丢包。
我又拿自己的水牛城做了下测试,可以看到每秒只收到3个包,非常地完美。
看到Vir新上的机房,东京、圣何塞,都有这个问题,可以看出他们新的网络架构有问题。
硬件层面没在交换机切分VLAN,导致所有母鸡和VPS都在同一个大VLAN。
软件层面没有使用Open vSwitch一类的技术进行隔离,导致问题更加严重。
Vir之前的技术人员应该不干了,现在是老板自己搞,或者来了个不懂技术的员工。
500引用C大分析的很到位。懂了。这就去操作一下,看看我的啥情况。那是不是可以说vir现在是四大金刚里面最菜的了?这个咋看啊。。。这个咋看啊。。。
500 这个咋看啊。。。
跑分: apt install -y sysbench && sysbench cpu run
核心: apt install -y mpstat && mpstat -P ALL
网络: apt install -y iptraf && iptraf-ng
流量: apt install -y nload && nload eno2
性能: apt install -y dstat && dstat -N eno2
收包: apt install -y sysstat && sar -n DEV 2 5
内存: apt install -y sysstat && sar -B 5 5
读写: apt install -y sysstat && sar -b 1 2
硬盘: apt install -y sysstat && sar -d -p 1 1