为何网络服务一定要具有负载均衡能力及高可用性

下文给大家带来为何网络服务一定要具有负载均衡能力及高可用性,希望能够给大家在实际运用中带来一定的帮助,负载均衡涉及的东西比较多,理论也不多,网上有很多书籍,今天我们就用创新互联在行业内累计的经验来做一个解答。    

创新互联是一家专注网站建设、网络营销策划、微信小程序开发、电子商务建设、网络推广、移动互联开发、研究、服务为一体的技术型公司。公司成立10余年以来,已经为上千余家成都湿喷机各业的企业公司提供互联网服务。现在,服务的上千余家客户与我们一路同行,见证我们的成长;未来,我们一起分享成功的喜悦。

很多时候,企业里面的一些关键型网络服务,不仅数据吞吐量相当大,而且还不允许随便离线的,所以就要求我们的网络服务一定要具有负载均衡能力及高可用性。数据吞吐量大,很多人就说了,这个简单,在我们的关键业务云服务器上多装几张网卡,均衡负载也就可以了。但是如果多网卡,多IP,不仅浪费了IP资源,更麻烦的是在客户访问的过程中如果出现了某张网卡离线的情况时,还需要重新连接另一IP的网卡才能继续会话,这是一件很头疼的事,有没有一个两全其美的办法了。让我们的设备既能使用多网卡均衡负载,又可以使用同一个IP对外服务。有,那么今天就给大家分享一下,如何实现多网卡绑定同一IP,既能负载均衡又可以实现实现网络服务的高可用性。

为何网络服务一定要具有负载均衡能力及高可用性

一、环境需求

交换机设备:两台支持动态链聚合功能的交换机或者一台普通交换机

网卡设备:两张网卡

操作操作:Centos6.8

服务需求:停用NetworkManager服务

二、Bonding技术

将多块网卡绑定同一IP地址对外提供服务,可以实现高可用或者负载均衡。当然,直接给两块网卡设置同一IP地址是不可能的。通过bonding技术,我们可以将两块网卡的MAC地址修改为一样的,这样就可以使用同一IP连续外提供服务了。

三、Bonding的工作模式(7种模式)

mode 0:(balance-rr) Round-robin policy(平衡轮转策略)

特点:传输数据包顺序是依次传输(即:第1个包走eth0,下一个包就走eth3....一直循环下去,直到最后一个传输完毕),此模式提供负载平衡和高可用性(容错能力),但是我们知道如果一个连接或者会话的数据包从不同的接口发出的话,中途再经过不同的链路,在客户端很有可能会出现数据包无序到达的问题,而无序到达的数据包需要重新要求被发送,这样网络的吞吐能力就会下降

mode 1:(active-backup) Active-backup policy(活动-备份策略)

特点:当一个活动SLAVE连接失败时,会主动激活另一个备用SLAVE,绑定的MAC地址仅有一个是对外有效的,以免让交换机产生混乱。此模式只提供了高可用性(容错能力),由此可见此算法的优点是可以提供高网络连接的可用性,但是它的资源利用率较低,只有一个接口处于工作状态,在有N个网络接口的情况下,资源利用率为1/N

mode 2:(balance-xor) XOR policy(平衡策略)

特点:基于指定的传输HASH策略传输数据包。缺省的策略是:(源MAC地址 XOR 目标MAC地址) %slave数量。其他的传输策略可以通过xmit_hash_policy选项指定,此模式提供负载均衡和容错能力

mode 3:(broadcast)广播策略

特点:在每个slave接口上传输每个数据包,此模式提供了容错能力,但会加大网络设备的吞吐量

mode 4:(IEEE 802.3ad Dynamic link aggregation)动态链接聚合

特点:创建一个聚合组,它们共享同样的速率和双工设定。根据802.3ad规范将多个slave工作在同一个激活的聚合体下。

外出流量的slave选举是基于传输hash策略,该策略可以通过xmit_hash_policy选项从缺省的XOR策略改变到其他策略。需要注意的是,并不是所有的传输策略都是802.3ad适应的,尤其考虑到在802.3ad标准43.2.4章节提及的包乱序问题。不同的实现可能会有不同的适应性。

必要条件:

条件1:ethtool支持获取每个slave的速率和双工设定

条件2:switch(交换机)支持IEEE 802.3ad Dynamic link aggregation

条件3:大多数switch(交换机)需要经过特定配置才能支持802.3ad模式

mode 5:(balance-tlb) Adaptive transmit load balancing(适配器传输负载均衡)

特点:不需要任何特别的switch(交换机)支持的通道bonding。在每个slave上根据当前的负载(根据速度计算)分配外出流量。如果正在接受数据的slave出故障了,另一个slave接管失败的slave的MAC地址,此模式提供了负载均衡能力。

必要条件:ethtool必须支持获取每个slave的速率

为何网络服务一定要具有负载均衡能力及高可用性

mode 6:(balance-alb) Adaptive load balancing(适配器适应性负载均衡)

特点:该模式包含了balance-tlb模式,同时加上针对IPV4流量的接收负载均衡(receive load balance, rlb),而且不需要任何switch(交换机)的支持。接收负载均衡是通过ARP协商实现的。bonding驱动截获本机发送的ARP应答,并把源硬件地址改写为bond中某个slave的唯一硬件地址,从而使得不同的对端使用不同的硬件地址进行通信,此模式提供负载均衡,也提供高可用性(容错能力)。

来自服务器端的接收流量也会被均衡。当本机发送ARP请求时,bonding驱动把对端的IP信息从ARP包中复制并保存下来。当ARP应答从对端到达时,bonding驱动把它的硬件地址提取出来,并发起一个ARP应答给bond中的某个slave。使用ARP协商进行负载均衡的一个问题是:每次广播 ARP请求时都会使用bond的硬件地址,因此对端学习到这个硬件地址后,接收流量将会全部流向当前的slave。这个问题通过给所有的对端发送更新(ARP应答)来解决,应答中包含他们独一无二的硬件地址,从而导致流量重新分布。当新的slave加入到bond中时,或者某个未激活的slave重新激活时,接收流量也要重新分布。接收的负载被顺序地分布(round robin)在bond中最高速的slave上。

当某个链路被重新接上,或者一个新的slave加入到bond中,接收流量在所有当前激活的slave中全部重新分配,通过使用指定的MAC地址给每个 client发起ARP应答。下面介绍的updelay参数必须被设置为某个大于等于switch(交换机)转发延时的值,从而保证发往对端的ARP应答不会被switch(交换机)阻截。

必要条件:

条件1:ethtool必须支持获取每个slave的速率

条件2:底层驱动支持设置某个设备的硬件地址,从而使得总是有个slave(curr_active_slave)使用bond的硬件地址,同时保证每个bond中的slave都有一个唯一的硬件地址。如果curr_active_slave出故障,它的硬件地址将会被新选出来的curr_active_slave接管

实际生产环境中应用比较多的也就mode0、mode1、mode6,其它应该场景不多

四、创建实例

我们以创建活动-备份模式为例,演示创建过程,其它模式只需要把mode={0-6}修改一下,再重启网络服务就可以

第一步:建立双网卡绑定文件

[root@Centos6 network-scripts]# vim ifcfg-bond0

[root@Centos6 network-scripts]# cat ifcfg-bond0 

DEVCIE=bond0

BOOTPROTO=none

BONDING_OPTS="miimon=100 mode=1"

IPADDR=10.1.253.253

PREFIX=16

[root@Centos6 network-scripts]# 

第二步:修改两张网卡的配置文件

[root@Centos6 network-scripts]# vim ifcfg-eth0

[root@Centos6 network-scripts]# cat ifcfg-eth0

DEVICE=eth0

BOOTPROTO=none

MASTER=bond0

SLAVE=yes

[root@Centos6 network-scripts]# 

[root@Centos6 network-scripts]# vim ifcfg-eth3

[root@Centos6 network-scripts]# cat ifcfg-eth3

DEVICE=eth3

BOOTPROTO=none

MASTER=bond0

SLAVE=yes

[root@Centos6 network-scripts]# 

文件配置基本工作完成,可以进行下一步了

第三步:重启网络服务(确保NetworkManager服务是处于停止状态的)

[root@Centos6 network-scripts]# service network restart

Shutting down interface bond0:                             [  OK  ]

Shutting down loopback interface:                          [  OK  ]

Bringing up loopback interface:                            [  OK  ]

Bringing up interface bond0:  Determining if ip address 10.1.253.253 is already in use for device bond0...

                                                          [  OK  ]

[root@Centos6 network-scripts]# ifconfig

bond0     Link encap:Ethernet  HWaddr 00:0C:29:C8:72:26  

         inet addr:10.1.253.253  Bcast:10.1.255.255  Mask:255.255.0.0

         inet6 addr: fe80::20c:29ff:fec8:7226/64 Scope:Link

         UP BROADCAST RUNNING MASTER MULTICAST  MTU:1500  Metric:1

         RX packets:13897 errors:0 dropped:0 overruns:0 frame:0

         TX packets:869 errors:0 dropped:0 overruns:0 carrier:0

         collisions:0 txqueuelen:0 

         RX bytes:1295315 (1.2 MiB)  TX bytes:84869 (82.8 KiB)

eth0      Link encap:Ethernet  HWaddr 00:0C:29:C8:72:26  

         UP BROADCAST RUNNING SLAVE MULTICAST  MTU:1500  Metric:1

         RX packets:12376 errors:0 dropped:0 overruns:0 frame:0

         TX packets:789 errors:0 dropped:0 overruns:0 carrier:0

         collisions:0 txqueuelen:1000 

         RX bytes:1145956 (1.0 MiB)  TX bytes:77363 (75.5 KiB)

eth3      Link encap:Ethernet  HWaddr 00:0C:29:C8:72:26  

         UP BROADCAST SLAVE MULTICAST  MTU:1500  Metric:1

         RX packets:1528 errors:0 dropped:0 overruns:0 frame:0

         TX packets:80 errors:0 dropped:0 overruns:0 carrier:0

         collisions:0 txqueuelen:1000 

         RX bytes:149913 (146.3 KiB)  TX bytes:7506 (7.3 KiB)

lo        Link encap:Local Loopback  

         inet addr:127.0.0.1  Mask:255.0.0.0

         inet6 addr: ::1/128 Scope:Host

         UP LOOPBACK RUNNING  MTU:65536  Metric:1

         RX packets:344 errors:0 dropped:0 overruns:0 frame:0

         TX packets:344 errors:0 dropped:0 overruns:0 carrier:0

         collisions:0 txqueuelen:0 

         RX bytes:24240 (23.6 KiB)  TX bytes:24240 (23.6 KiB)

[root@Centos6 network-scripts]# 

使用cat /proc/net/bonding/bond0查看当前网卡的工作状态

[root@Centos6 ~]# cat /proc/net/bonding/bond0 

Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)

Bonding Mode: fault-tolerance (active-backup)

Primary Slave: None

Currently Active Slave: eth0

MII Status: up

MII Polling Interval (ms): 100

Up Delay (ms): 0

Down Delay (ms): 0

Slave Interface: eth0

MII Status: up

Speed: 1000 Mbps

Duplex: full

Link Failure Count: 0

Permanent HW addr: 00:0c:29:c8:72:26

Slave queue ID: 0

Slave Interface: eth3

MII Status: up

Speed: 1000 Mbps

Duplex: full

Link Failure Count: 0

Permanent HW addr: 00:0c:29:c8:72:30

Slave queue ID: 0

[root@Centos6 ~]# 

第四步:在Centos7上去ping刚才配置好双网卡绑定的Centos6,随便停用其中的任意一张网卡,观察ping的过程会不会丢包

现在我们在Centos7开启ping Centos6,一切正常,然后停用Centos6的网卡2后查看ping的过程有没有丢包情况

[root@Centos6 network-scripts]# cat /proc/net/bonding/bond0 

Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)

Bonding Mode: fault-tolerance (active-backup)

Primary Slave: None

Currently Active Slave: eth0

MII Status: up

MII Polling Interval (ms): 100

Up Delay (ms): 0

Down Delay (ms): 0

Slave Interface: eth0

MII Status: up

Speed: 1000 Mbps

Duplex: full

Link Failure Count: 0

Permanent HW addr: 00:0c:29:c8:72:26

Slave queue ID: 0

Slave Interface: eth3

MII Status: down

Speed: Unknown

Duplex: Unknown

Link Failure Count: 0

Permanent HW addr: 00:0c:29:c8:72:30

Slave queue ID: 0

[root@Centos6 network-scripts]# 

停用网卡2 ,网络正常连通,性能差一点机器的话,最多丢两三个包而矣

再启动网卡2,停用网卡1,继续观察ping的过程

[root@Centos6 network-scripts]# cat /proc/net/bonding/bond0 

Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)

Bonding Mode: fault-tolerance (active-backup)

Primary Slave: None

Currently Active Slave: eth3

MII Status: up

MII Polling Interval (ms): 100

Up Delay (ms): 0

Down Delay (ms): 0

Slave Interface: eth0

MII Status: down

Speed: Unknown

Duplex: Unknown

Link Failure Count: 1

Permanent HW addr: 00:0c:29:c8:72:26

Slave queue ID: 0

Slave Interface: eth3

MII Status: up

Speed: 1000 Mbps

Duplex: full

Link Failure Count: 0

Permanent HW addr: 00:0c:29:c8:72:30

Slave queue ID: 0

[root@Centos6 network-scripts]# 

启用网卡2 、停用网卡1 后,网络依然正常连通,即使有丢的,也就丢两三个,对外服务不会有什么大影响,我这里停用任意一张网卡,都没有丢包的情况。

所以说mode1模式随便那张网卡故障,都可以正常提供服务,也就是说具有有高可用性,但是不具有负载均衡能力,资源利用率太低。

五、bonding模式对比

1、平衡轮转策略(mode0)在不经过交换机的情况下只能允许网卡2故障,如果两张网卡分别接两个支持动态链路聚合的交换机时,两张网卡中的任意一张都允许随时故障,所以说轮转模式提供了负载均衡,同时也提供了高可用性,只是需要两张网卡跨接在支持动态链路聚合功能的交换机的两侧

[root@Centos6 network-scripts]# cat /proc/net/bonding/bond0 

Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)

Bonding Mode: load balancing (round-robin)

MII Status: up

MII Polling Interval (ms): 100

Up Delay (ms): 0

Down Delay (ms): 0

Slave Interface: eth0

MII Status: up

Speed: 1000 Mbps

Duplex: full

Link Failure Count: 0

Permanent HW addr: 00:0c:29:c8:72:26

Slave queue ID: 0

Slave Interface: eth3

MII Status: down

Speed: Unknown

Duplex: Unknown

Link Failure Count: 1

Permanent HW addr: 00:0c:29:c8:72:30

Slave queue ID: 0

[root@Centos6 network-scripts]# 

2、适配器适应性负载均衡策略(mode6)本策略和平衡轮转策略(mode0)有相似之处,不同之处是mode6模式不需要交换机支持动态链路聚合功能就可以实现平衡轮转,而且两张网卡不用捆绑同一MAC,也就是说可以使用各自的MAC,同时也不需要跨接在交换机的两侧,两张网卡可以接在同一台普通的交换机上

[root@Centos6 network-scripts]# cat /proc/net/bonding/bond0 

Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)

Bonding Mode: adaptive load balancing

Primary Slave: None

Currently Active Slave: eth3

MII Status: up

MII Polling Interval (ms): 100

Up Delay (ms): 0

Down Delay (ms): 0

Slave Interface: eth0

MII Status: down

Speed: Unknown

Duplex: Unknown

Link Failure Count: 1

Permanent HW addr: 00:0c:29:c8:72:26

Slave queue ID: 0

Slave Interface: eth3

MII Status: up

Speed: 1000 Mbps

Duplex: full

Link Failure Count: 0

Permanent HW addr: 00:0c:29:c8:72:30

Slave queue ID: 0

[root@Centos6 network-scripts]# 

在这里需要提醒各位的是:平衡轮转策略(mode0)必须要是两张网卡各自连接两台都支持动态链路聚合功能的交换机时才能验证出真实效果,虚拟机上实验环境不满足,所以无法验证。如果实际生产环境中,即想要有高可用性,同时还具备冗余能力,建议选择mode0,因为这样两张网卡分别接不同的交换机,网卡坏掉了还有另外一块,交换机坏掉了还有另外一台,所以是最有保障的,当然环境建设的代价也就更高了。mode6的两张网卡是接在同一台交换机上,如果交换机故障了,所谓的负载均衡与高可用性也就不谈了。如果是内网的服务,是可以考虑mode6的。

看了以上关于为何网络服务一定要具有负载均衡能力及高可用性,如果大家还有什么地方需要了解的可以在创新互联行业资讯里查找自己感兴趣的或者找我们的专业技术工程师解答的,创新互联技术工程师在行业内拥有十几年的经验了。

 

 



分享文章:为何网络服务一定要具有负载均衡能力及高可用性
URL链接:http://csdahua.cn/article/pgjjcp.html
扫二维码与项目经理沟通

我们在微信上24小时期待你的声音

解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流