Keepalived基础知识-运维小结-睿象云平台

Keepalived基础知识-运维小结

本站部分文章、图片属于网络上可搜索到的公开信息，均用于学习和交流用途，不能代表睿象云的观点、立场或意见。我们接受网民的监督，如发现任何违法内容或侵犯了您的权益，请第一时间联系小编邮箱jiasou666@gmail.com 处理。

Keepalived基础知识-运维小结

keepalived介绍keepalived观察其名可知，保持存活，在网络里面就是保持在线了，也就是所谓的高可用或热备，它集群管理中保证集群高可用的一个服务软件，其功能类似于heartbeat，用来防止单点故障(单点故障是指一旦某一点出现故障就会导致整个系统架构的不可用)的发生。说到keepalived就不得不说VRRP协议，可以说这个协议就是keepalived实现的基础，那么首先我们来看看VRRP协议。

VRRP协议介绍学过网络的朋友都知道，网络在设计的时候必须考虑到冗余容灾，包括线路冗余，设备冗余等，防止网络存在单点故障，那在路由器或三层交换机处实现冗余就显得尤为重要。在网络里面有个协议就是来做这事的，这个协议就是VRRP协议，Keepalived就是巧用VRRP协议来实现高可用性(HA)的发生。VRRP全称Virtual Router Redundancy Protocol，即虚拟路由冗余协议。对于VRRP，需要清楚知道的是：1）VRRP是用来实现路由器冗余的协议。2）VRRP协议是为了消除在静态缺省路由环境下路由器单点故障引起的网络失效而设计的主备模式的协议，使得发生故障而进行设计设备功能切换时可以不影响内外数据通信，不需要再修改内部网络的网络参数。3）VRRP协议需要具有IP备份，优先路由选择，减少不必要的路由器通信等功能。4）VRRP协议将两台或多台路由器设备虚拟成一个设备，对外提供虚拟路由器IP（一个或多个）。然而，在路由器组内部，如果实际拥有这个对外IP的路由器如果工作正常的话，就是master，或者是通过算法选举产生的，MASTER实现针对虚拟路由器IP的各种网络功能，如ARP请求，ICMP，以及数据的转发等，其他设备不具有该IP，状态是BACKUP。除了接收MASTER的VRRP状态通告信息外，不执行对外的网络功能，当主级失效时，BACKUP将接管原先MASTER的网络功能。5）VRRP协议配置时，需要配置每个路由器的虚拟路由ID(VRID)和优先权值，使用VRID将路由器进行分组，具有相同VRID值的路由器为同一个组，VRID是一个0-255的整整数，；同一个组中的路由器通过使用优先权值来选举MASTER。，优先权大者为MASTER，优先权也是一个0-255的正整数。

keepalived工作原理keepalived可提供vrrp以及health-check功能，可以只用它提供双机浮动的vip（vrrp虚拟路由功能），这样可以简单实现一个双机热备高可用功能；keepalived是以VRRP虚拟路由冗余协议为基础实现高可用的，可以认为是实现路由器高可用的协议，即将N台提供相同功能的路由器组成一个路由器组，这个组里面有一个master和多个backup，master上面有一个对外提供服务的vip（该路由器所在局域网内其他机器的默认路由为该vip），master会发组播，当backup收不到VRRP包时就认为master宕掉了，这时就需要根据VRRP的优先级来选举一个backup当master。这样的话就可以保证路由器的高可用了。

下图是keepalived的组件图

keepalived也是模块化设计，不同模块复杂不同的功能，它主要有三个模块，分别是core、check和VRRP，其中：core模块：为keepalived的核心组件，负责主进程的启动、维护以及全局配置文件的加载和解析；check：负责健康检查，包括常见的各种检查方式；VRRP模块：是来实现VRRP协议的。

system call:系统调用watch dog:监控check和vrrp进程的看管者，check负责检测器子进程的健康状态，当其检测到master上的服务不可用时则通告vrrp将其转移至backup服务器上。

除此之外，keepalived还有下面两个组件：libipfwc：iptables(ipchains)库，配置LVS会用到libipvs*：配置LVS会用到注意，keepalived和LVS完全是两码事，只不过他们各负其责相互配合而已。

Keepalived作用Keepalived主要用作RealServer的健康状态检查以及LoadBalance主机和BackUP主机之间failover的实现。Keepalived的作用是检测web服务器的状态，如果有一台web服务器死机，或工作出现故障，Keepalived将检测到，并将有故障的web服务器从系统中剔除，当web服务器工作正常后Keepalived自动将web服务器加入到服务器群中，这些工作全部自动完成，不需要人工干涉，需要人工做的只是修复故障的web服务器。

----------------------------------------------------------------------------------------------------------------------------Keepalived和Heartbeat之间的对比1）Keepalived使用更简单：从安装、配置、使用、维护等角度上对比，Keepalived都比Heartbeat要简单得多，尤其是Heartbeat2.1.4后拆分成3个子项目，安装、配置、使用都比较复杂，尤其是出问题的时候，都不知道具体是哪个子系统出问题了；而Keepalived只有1个安装文件、1个配置文件，配置文件也简单很多；2）Heartbeat功能更强大：Heartbeat虽然复杂，但功能更强大，配套工具更全，适合做大型集群管理，而Keepalived主要用于集群倒换，基本没有管理功能；3）协议不同：Keepalived使用VRRP协议进行通信和选举，Heartbeat使用心跳进行通信和选举；Heartbeat除了走网络外，还可以通过串口通信，貌似更可靠； Keepalived使用的vrrp协议方式，虚拟路由冗余协议；Heartbeat是基于主机或网络的服务的高可用方式； Keepalived的目的是模拟路由器的双机；Heartbeat的目的是用户service的双机4）使用方式基本类似：如果要基于两者设计高可用方案，最终都要根据业务需要写自定义的脚本，Keepalived的脚本没有任何约束，随便怎么写都可以；Heartbeat的脚本有约束，即要支持service start/stop/restart这种方式，而且Heartbeart提供了很多默认脚本，简单的绑定ip，启动apache等操作都已经有了；

使用建议：优先使用Keepalived，当Keepalived不够用的时候才选择Heartbeatlvs的高可用建议用Keepavlived业务的高可用用Heartbeat--------------------------------------------------------------------------------------------------------------------------

keepalived的配置文件keepalived只有一个配置文件keepalived.conf，配置文件里面主要包括以下几个配置项，分别是global_defs、static_ipaddress、static_routes、VRRP_script、VRRP_instance和virtual_server。总的来说，keepalived主要有三类区域配置，注意不是三种配置文件，是一个配置文件里面三种不同类别的配置区域：1）全局配置(Global Configuration)2）VRRPD配置3）LVS配置

下面就重点来说说这三类区域的配置：1）全局配置全局配置又包括两个子配置：全局定义(global definition)静态路由配置(static ipaddress/routes)

1--全局定义(global definition)配置范例：

global_defs {notification_email {admin@example.com }notification_email_from admin@example.comsmtp_server 127.0.0.1stmp_connect_timeout 30router_id node1}

全局配置解析global_defs全局配置标识，表面这个区域{}是全局配置

notification_email {admin@example.comadmin@ywlm.net}

表示keepalived在发生诸如切换操作时需要发送email通知，以及email发送给哪些邮件地址，邮件地址可以多个，每行一个notification_email_from admin@example.com表示发送通知邮件时邮件源地址是谁smtp_server 127.0.0.1表示发送email时使用的smtp服务器地址，这里可以用本地的sendmail来实现smtp_connect_timeout 30连接smtp连接超时时间router_id node1机器标识

2--静态地址和路由配置范例

static_ipaddress {192.168.1.1/24 brd + dev eth0 scope global192.168.1.2/24 brd + dev eth1 scope global}static_routes {src $SRC_IP to $DST_IP dev $SRC_DEVICEsrc $SRC_IP to $DST_IP via $GW dev $SRC_DEVICE}

这里实际上和系统里面用命令配置IP地址和路由的曹一样，例如：192.168.1.1/24 brd + dev eth0 scope global 相当于: ip addr add 192.168.1.1/24 brd + dev eth0 scope global就是给eth0配置IP地址路由同理一般这个区域不需要配置这里实际上就是给服务器配置真实的IP地址和路由的，在复杂的环境下可能需要配置，一般不会用这个来配置，我们可以直接用vi /etc/sysconfig/network-script/ifcfg-eth1来配置，切记这里可不是VIP哦，不要搞混淆了，切记切记！

2）VRRPD配置VRRPD配置包括三个类：VRRP同步组(synchroization group)VRRP实例(VRRP Instance)VRRP脚本

1--VRRP同步组(synchroization group)配置范例

notify_master /path/to/to_master.sh：表示当切换到master状态时，要执行的脚本notify_backup /path_to/to_backup.sh：表示当切换到backup状态时，要执行的脚本notify_fault “/path/fault.sh VG_1”notify /path/to/notify.sh：smtp alter表示切换时给global defs中定义的邮件地址发送右键通知

2--VRRP实例(instance)配置范例

3--VRRP脚本范例

首先在vrrp_script区域定义脚本名字和脚本执行的间隔和脚本执行的优先级变更vrrp_script check_running {

script “/usr/local/bin/check_running”interval 10 #脚本执行间隔weight 10 #脚本结果导致的优先级变更：10表示优先级+10；-10则表示优先级-10}

然后在实例(vrrp_instance)里面引用，有点类似脚本里面的函数引用一样：先定义，后引用函数名

track_script {check_running weight 20}

注意：VRRP脚本(vrrp_script)和VRRP实例(vrrp_instance)属于同一个级别

3)LVS配置如果你没有配置LVS+keepalived，那么无需配置这段区域，如果你用的是nginx来代替LVS，这无需配置这款，这里的LVS配置是专门为keepalived+LVS集成准备的。注意了，这里LVS配置并不是指真的安装LVS然后用ipvsadm来配置它，而是用keepalived的配置文件来代替ipvsadm来配置LVS，这样会方便很多，一个配置文件搞定这些，维护方便，配置方便是也！这里LVS配置也有两个配置一个是虚拟主机组配置一个是虚拟主机配置

1--虚拟主机组配置文件详解这个配置是可选的，根据需求来配置吧，这里配置主要是为了让一台realserver上的某个服务可以属于多个Virtual Server，并且只做一次健康检查:virtual_server_group { # VIP port fwmark }

2--虚拟主机配置virtual server可以以下面三种的任意一种来配置:a）virtual server IP portb）virtual server fwmark intc）virtual server group string

下面以第一种比较常用的方式来配详细解说一下：

virtual_server 192.168.1.2 80 { #设置一个virtual server: VIP:Vportdelay_loop 3 # service polling的delay时间，即服务轮询的时间间隔lb_algo rr|wrr|lc|wlc|lblc|sh|dh #LVS调度算法lb_kind NAT|DR|TUN #LVS集群模式 persistence_timeout 120 #会话保持时间（秒为单位），即以用户在120秒内被分配到同一个后端realserverpersistence_granularity #LVS会话保持粒度，ipvsadm中的-M参数，默认是0xffffffff，即每个客户端都做会话保持protocol TCP #健康检查用的是TCP还是UDPha_suspend #suspendhealthchecker’s activityvirtualhost #HTTP_GET做健康检查时，检查的web服务器的虚拟主机（即host：头）sorry_server #备用机，就是当所有后端realserver节点都不可用时，就用这里设置的，也就是临时把所有的请求都发送到这里啦real_server #后端真实节点主机的权重等设置，主要，后端有几台这里就要设置几个{weight 1 #给每台的权重，0表示失效(不知给他转发请求知道他恢复正常)，默认是1inhibit_on_failure #表示在节点失败后，把他权重设置成0，而不是冲IPVS中删除notify_up | #检查服务器正常(UP)后，要执行的脚本notify_down | #检查服务器失败(down)后，要执行的脚本HTTP_GET #健康检查方式{url { #要坚持的URL，可以有多个path / #具体路径digest status_code 200 #返回状态码}connect_port 80 #监控检查的端口bindto #健康检查的IP地址connect_timeout 3 #连接超时时间nb_get_retry 3 #重连次数delay_before_retry 2 #重连间隔} # END OF HTTP_GET|SSL_GET#下面是常用的健康检查方式，健康检查方式一共有HTTP_GET|SSL_GET|TCP_CHECK|SMTP_CHECK|MISC_CHECK这些#TCP方式TCP_CHECK {connect_port 80bindto 192.168.1.1connect_timeout 4} # TCP_CHECK# SMTP方式，这个可以用来给邮件服务器做集群SMTP_CHECKhost {connect_ip connect_port #默认检查25端口14 KEEPALIVEDbindto }connect_timeout retry delay_before_retry # “smtp HELO”ž|·-ëê§Œà”helo_name |} #SMTP_CHECK#MISC方式，这个可以用来检查很多服务器只需要自己会些脚本即可MISC_CHECK{misc_path | #外部程序或脚本misc_timeout #脚本或程序执行超时时间misc_dynamic #这个就很好用了，可以非常精确的来调整权重，是后端每天服务器的压力都能均衡调配，这个主要是通过执行的程序或脚本返回的状态代码来动态调整weight值，使权重根据真实的后端压力来适当调整，不过这需要有过硬的脚本功夫才行哦#返回0：健康检查没问题，不修改权重#返回1：健康检查失败，权重设置为0#返回2-255：健康检查没问题，但是权重却要根据返回代码修改为返回码-2，例如如果程序或脚本执行后返回的代码为200，#那么权重这回被修改为 200-2}} # Realserver} # Virtual Server

================================小案例分享=============================

============下面是曾经使用过的一个案例: 三台节点机器,配置三个VIP,实行相互之间的"两主两从"模式=============

server1：第一台节点的keepalived.conf配置. 其中VIP:192.168.20.187[root@keepalived-node01 ~]# cat /etc/keepalived/keepalived.conf ! Configuration File for keepalivedglobal_defs { notification_email { kevin@bobo.com } smtp_server 192.168.200.1 smtp_connect_timeout 30 router_id innodb_cluster #局域网中需要共享该vip的服务器，该配置要一致 vrrp_skip_check_adv_addr vrrp_garp_interval 0 vrrp_gna_interval 0}vrrp_instance VI_1 { state MASTER #状态为master,表明 keepalived 启动后会抢占IP, 但，下面的优先级值201要高于从库的优先级 101 interface eth0 #viP 绑定的网卡 virtual_router_id 191 #这个组队标志，同一个vrrp 下的值一致，主从一致 priority 201 # 主库为201，高于从库101 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.20.187 #这是VIP 值 }}vrrp_instance VI_2 { state BACKUP #状态为 BACKUP,表明 keepalived 启动后不抢占IP interface eth0 #VIP 绑定的接口 virtual_router_id 193 #组队标识，同一个vrrp 下的值一致 priority 101 #设置优先级小于另一个节点的priority 上值。 advert_int 1 authentication { auth_type PASS auth_pass 3333 } virtual_ipaddress { 192.168.20.189 }}启动keepalived[root@keepalived-node01 ~]# /etc/init.d/keepalived start[root@keepalived-node01 ~]# ps -ef|grep keepalived root 13746 1 0 16:31 ? 00:00:00 /usr/sbin/keepalived -Droot 13747 13746 0 16:31 ? 00:00:00 /usr/sbin/keepalived -Droot 13748 13746 0 16:31 ? 00:00:00 /usr/sbin/keepalived -Droot 14089 13983 0 16:36 pts/1 00:00:00 grep --color=auto keepalived启动keepalived服务后,查看ip[root@keepalived-node01 ~]# ip addr1: lo: mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000 link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8 scope host lo valid_lft forever preferred_lft forever inet6 ::1/128 scope host valid_lft forever preferred_lft forever2: eth0: mtu 1500 qdisc mq state UP group default qlen 1000 link/ether 2e:ab:68:68:ee:90 brd ff:ff:ff:ff:ff:ff inet 192.168.20.191/24 brd 192.168.20.255 scope global noprefixroute eth0 valid_lft forever preferred_lft forever inet 192.168.20.187/32 scope global eth0 valid_lft forever preferred_lft forever inet6 fe80::2cab:68ff:fe68:ee90/64 scope link valid_lft forever preferred_lft forever==========================================================================================server2：第二台节点的keepalived.conf配置. 其中VIP:192.168.20.188[root@keepalived-node02 ~]# cat /etc/keepalived/keepalived.conf ! Configuration File for keepalivedglobal_defs { notification_email { kevin@bobo.com } smtp_server 192.168.200.1 smtp_connect_timeout 30 router_id innodb_cluster #局域网中需要共享该vip的服务器，该配置要一致 vrrp_skip_check_adv_addr vrrp_garp_interval 0 vrrp_gna_interval 0}vrrp_instance VI_1 { state MASTER #状态为master,表明 keepalived 启动后会抢占IP, 但，下面的优先级值201要高于从库的优先级 101 interface eth0 #viP 绑定的网卡 virtual_router_id 192 #这个组队标志，同一个vrrp 下的值一致，主从一致 priority 201 # 主库为201，高于从库101 advert_int 1 authentication { auth_type PASS auth_pass 2222 } virtual_ipaddress { 192.168.20.188 #这是VIP 值 }}vrrp_instance VI_2 { state BACKUP #状态为 BACKUP,表明 keepalived 启动后不抢占IP interface eth0 #VIP 绑定的接口 virtual_router_id 191 #组队标识，同一个vrrp 下的值一致 priority 101 #设置优先级小于另一个节点的priority 上值。 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.20.187 }}启动keepalived[root@keepalived-node02 ~]# /etc/init.d/keepalived start[root@keepalived-node02 ~]# ps -ef|grep keepalivedroot 13327 1 0 16:32 ? 00:00:00 /usr/sbin/keepalived -Droot 13328 13327 0 16:32 ? 00:00:00 /usr/sbin/keepalived -Droot 13329 13327 0 16:32 ? 00:00:00 /usr/sbin/keepalived -Droot 13570 13529 0 16:39 pts/1 00:00:00 grep --color=auto keepalived启动keepalived服务后查看ip[root@keepalived-node02 ~]# ip addr1: lo: mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000 link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8 scope host lo valid_lft forever preferred_lft forever inet6 ::1/128 scope host valid_lft forever preferred_lft forever2: eth0: mtu 1500 qdisc mq state UP group default qlen 1000 link/ether 76:6d:74:97:03:15 brd ff:ff:ff:ff:ff:ff inet 192.168.20.192/24 brd 192.168.20.255 scope global noprefixroute eth0 valid_lft forever preferred_lft forever inet 192.168.20.188/32 scope global eth0 valid_lft forever preferred_lft forever inet6 fe80::746d:74ff:fe97:315/64 scope link valid_lft forever preferred_lft forever==========================================================================================server3：第三台节点的keepalived.conf配置. 其中VIP:192.168.20.189[root@keepalived-node03 ~]# cat /etc/keepalived/keepalived.conf ! Configuration File for keepalivedglobal_defs { notification_email { kevin@bobo.com } smtp_server 192.168.200.1 smtp_connect_timeout 30 router_id innodb_cluster #和server1 一致全局唯一 vrrp_skip_check_adv_addr # vrrp_strict vrrp_garp_interval 0 vrrp_gna_interval 0}vrrp_instance VI_1 { state BACKUP #主是master,从就是backup interface eth0 virtual_router_id 192 # 组队标识，同一个vrrp 下一致 priority 101 #优先级也变小 advert_int 1 authentication { auth_type PASS auth_pass 2222 } virtual_ipaddress { 192.168.20.188 }}vrrp_instance VI_2 { state MASTER #主变成MASTER interface eth0 #绑定网卡 virtual_router_id 193 #组队标志，同一个vip 下一致 priority 201 #优先级提升 advert_int 1 authentication { auth_type PASS auth_pass 3333 } virtual_ipaddress { 192.168.20.189 }}启动keepalived[root@keepalived-node03 ~]# /etc/init.d/keepalived start[root@keepalived-node03 ~]# ps -ef|grep keepalivedroot 13134 1 0 16:33 ? 00:00:00 /usr/sbin/keepalived -Droot 13135 13134 0 16:33 ? 00:00:00 /usr/sbin/keepalived -Droot 13136 13134 0 16:33 ? 00:00:00 /usr/sbin/keepalived -Droot 13526 13460 0 16:41 pts/1 00:00:00 grep --color=auto keepalived启动keepalived服务后查看ip[root@keepalived-node03 ~]# ip addr1: lo: mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000 link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8 scope host lo valid_lft forever preferred_lft forever inet6 ::1/128 scope host valid_lft forever preferred_lft forever2: eth0: mtu 1500 qdisc mq state UP group default qlen 1000 link/ether 22:ee:46:41:f0:e6 brd ff:ff:ff:ff:ff:ff inet 192.168.20.193/24 brd 192.168.20.255 scope global noprefixroute eth0 valid_lft forever preferred_lft forever inet 192.168.20.189/32 scope global eth0 valid_lft forever preferred_lft forever inet6 fe80::20ee:46ff:fe41:f0e6/64 scope link valid_lft forever preferred_lft forever温馨提示:如上,keepalived.conf配置后,重启keepalived服务,重启成功并且vip地址已经有了,但是死活ping不通vip地址!!这是因为keepalived.conf文件中的vrrp_strict参数引起的,将该参数注释掉就可以了!!!vrrp_strict 表示严格执行VRRP协议规范，此模式不支持节点单播

VIP地址ping不通,需要注释vrrp_strict参数配置即可!