一、Heartbeat

作者: print("") 分类: linux 发布时间: 2017-05-18 22:49

8..1.1 heartbeat 作用
通过它可以将资源(IP及程序服务等资源)从一台故障计算机快速转移到另一台运转正常的机器继续服务、在实际生产应用场景、heartbeat 的功能和另一个高可用开源软件keepalived 有很多相同之处
8.1.2 heartbeat 工作原理
通过修改ha的配置文件、指定哪一台heartbeat服务器作为主服务器、则另一台将自动成功备份服务器、然后在备份服务器上配置heartbeat守护程序来监听来自主服务器的心跳、将会启动故障转移程序、并取得主服务器上相关资源服务的所有权、接替主服务器继续不间断的提供服务、从而达到资源服务高可用的目的
以上描述的是heartbeat主备模式、heartbeat 还支持主主模式、即两台服务器互为主备、这时他们之间会互相发送报文来告诉对方之间当前的状态、如果在指定的时间内未收到对方发送的心跳报文、那么就认为对方失效、这时就会启动资源接管模块来接管运行在
对方主机上的资源或者服务、继续对用户提供服务、正常情况下、可以较好的实现主机故障后、业务不间断持续运行
8.1.3 heartbeat 的心跳连接
经过前面前面的叙述、应该很清楚了、要部署heartbeat 服务至少需要两台主机来完成、那么,这两台主机之间是如何互相通信和互相检测的呢?
下面是两台he主机通信的一些可行方法
1、串行电缆 (首选)
2、一根以太网电缆两网卡直连(生产环境常用的方式)
3、以太网电缆。通过交换机等网络设备连接(次选)
次选,增加了交换机的故障点、同时线路不是专用心跳线、容易受其他数据传输的影响 8.1.4 heartbeat 裂脑
由于两台高可用服务器对之间在指定时间内,无法互相检测到对方心跳而各自启动故障转移功能、取得了资源及服务的所有权、而此时的两台高可用服务对都还活着并正在正常运行、这就会导致一个IP或服务在两端同事启动而发生冲突的严重问题、最严重的是两台主机占用了同一个IP地址、这种会导致两端数据不一致或导致数据丢失、这种情况就被称为裂脑、也有人称为分区集群或大脑垂直分割、
 
8.1.4.2 导致裂脑发生的多种原因
一般来说,裂脑发生的多种原因
高可用服务器之间心跳线路故障、导致无法正常通信
高可用服务器对上开启了防火墙阻挡了心跳消息传输
高可用服务器上对心跳网卡地址信息配置不正确、导致发送心跳发送失败
其他服务配置不当等原因、如:心跳方式不同、心跳网络冲突、等。
 
8.1.4.2 防止裂脑发生的8种秘籍
发生裂脑时、对业务的影响是及其严重的、有时甚至是致命的、如:两台高可用服务器之间发生裂脑、导致互相争用一个IP资源、就如同我们在局域网内常见的IP地址冲突、两个机器就会有一个或两个都不正常、影响用户正常访问服务器、如果是应用数据库或者存储服务这种及其重要的高可用上、那就会导致用户发布的数据间断的写入两台不同服务器上的恶果、最终数据恢复极其困难或难以恢复、(当然、有NAS等公共存放的硬件会好一些)
实际生产环境中、我们可以从以下几个方面来防止裂脑问题的发生、
同事使用串行电缆和以太网电缆连接、同时用两条心跳线路、这样一条线路坏了、另一条线路还是好的、依然能传送心跳信息、(网卡设备和网线设备)
检测到裂脑时强行关闭一个心跳节点、(这个功能需要特殊设备支持、如stonith、fence)相当于程序上备节点发现心跳线路故障、发送关机命令到主节点
做好对裂脑的监控报警(如邮件及手机短线报警等)、在问题发生时认为第一时间介入仲裁、降低损失、当然对于一般的网站业务、这个损失是可控的
启动磁盘锁、正在服务一方锁住共享磁盘、裂脑发生时、让对方完成抢不走共享磁盘资源、另一方永远也得不到共享磁盘、现实中加入服务节点突然死机或崩溃、就不能执行解锁命令、后备节点也就接管不了共享资源和应用服务、于是有人在HA设计了智能锁、即、在服务的乙方只要发现心跳线路全部断开(检查不到对方)时开启磁盘锁、平时就不上锁
报警报在服务器接管之前、给人员出来留足够时间
不直接自动服务器接管、而是由人员控制接管
增加仲裁机制、确定谁该获得资源、这里有几个参考思路

  • 加一个仲裁机制、例如设置参考IP(如网关)、当心跳线路完全断开时、2个节点都有各自ping一下参考IP,不通则表明断点就在本端、不仅心跳线、还有堤外服务器的本地网络链路断了、这样就主动放弃竞争、让能够ping通参考IP的一段去接管服务、ping不通参考IP的一方可以自我重启、以彻底释放有可能还占用那些共享资源(heartbeat也有此功能)
  • 通过第三方服务器仲裁谁该获取资源、这个在阿里集团有类似的软件应用

8.1.6 heartbeat消息类型
Heartbeat 软件在工作中、一般来说、有三种消息类型、具体为:

  • 心跳消息
  • 集群转换消息
  • 重传请求

 
8.1.6.1 心跳消息
心跳消息为150字节的数据包、可能为单拨、广播或多播的方式、控制心跳频率及出现故障要等待多久进行故障转换
 
8.1.6.2 集群转换消息
ip-request 和 ip-request-resp
当主服务器恢复在线状态时、通过ip-request消息要求备机释放主服务器失败时取得的资源、然后备份服务器关闭释放主服务器失败时取得的资源及服务、
备份服务器释放主服务器失败时取得的资源及服务后、就会通过ip-request-resp消息通知主服务器它不在拥有该资源及服务、主服务器收到来自备份节点的ip-request-resp消息通过后,启动失败时释放的资源及服务、并开始提供正常服务。
8.1.6.3 重传请求
Rexmit-request 控制重传心跳请求、此消息不太重要,细节就不浪费笔墨了。
提示:以上心跳控制消息都使用udp 协议发送到/etc/ha.d/ha.cf 文件指定任意端口,或指定多播地址。
8.1.7 heartbeat ip 地址接管和故障转移
Heartbeat 是通过iP地址和ARP广播进行故障转移的
ARP广播:在主服务器故障时、备用节点接管资源后、会理解强制更新所有客户端本地的ARP表(清除客户端本地缓存失败服务器的VIP地址和mac地址的解析记录),确保客户端和新的主机对话
8.1.8 VIP/IP 别名/辅助IP
真实IP,又被称作管理IP、一般是配置在物理网卡的实际IP、这可以看做你本人的姓名:在负载均衡器及高可用环境中、管理IP是不对外提供用户访问服务的、而仅仅管理服务器用、如SSH连接服务器、可以通过这个管理IP
VIP是虚拟IP、这只是一个概念而已、可能会误导你、实际上就是heartbeat 零时绑定在物理网卡上的别名IP 如eht0:X,X 为0-255 的任意数字,你可以在一块网卡上绑定多个别名、在实际生产环境中、需要在DNS配置中把网站域名解析到这个VIP地址由这个VIP对用户提供服务:
这样做的好吃就是当提供服务器宕机以后,在接管的服务器上会直接会自动配置上同样的VIP提供服务、如果是使用管理IP的话,来回迁移难以做到。而且管理IP迁移走了,我们只能去机房连接服务器了、VIP的实质就是确保两台服务器各有一个管理IP不懂。就是随时可以连上机器、然后增加绑定其他ip
。这样就算VIP转移走了,也不至于服务器本身连接不上、因为还有管理IP呢、
手工配置VIP 的方法:
ifconfig eth0:1 192.168.10.1 netmask 255.255.255.0
############### heartbeat 软件默认是使用这个命令来添加VIP的
ip addr add 10.0.15.1/24 broadcast 10.0.15.255 dev eth1 (辅助IP)
############ keepalived 软件默认使用这个命令来添加VIP
手工删除VIP的方法
ip addr del 10.0.15.1/24 broadcast 10.0.15.255 dev eth1
ifconfig eht:1 down
 
8.1.9 heartbeat 脚本默认目录
/etc/init.d/
/etc/ha.d/resource.d/
提示:把脚本放到上面两个路径其中任意一个下面、然后heartbeat 的 haresource 配置文件中配置脚本名称就能调用该脚本、进而控制资源和服务的启动和关闭。
 
8.1.10 heartbeat 配置文件
Heartbeat 的默认配置文件目录为/etc/ha.d  heartbeat常用的配置文件有三个 ha.cf , authkey ,haresource 如果你仔细看。可以发现名字信息就如其实际功能、这里列成表格方面大家学习了解

配置名称 作用 备注
ha.cf Heartbeat参数配置文件 在这里配置heartbeat的一些基本参数
Authkey Heartbeat认证文件 高可用服务器之间根据对端authkey对对端进行认证
Haresource Heartbeat资源配置文件 如配置IP资源及脚本程序等

 
8.2 部署heartbeat 需求
假设有两台服务器picdata-1-1/picdate-1-2 ,其实际IP分别为10.0.0.7(picdata-1-1),10.0.0.8(picdate-1-2)。
配置目标:要求heartbeat 服务启动后、picdata-1-1机器初始化VIP:10.0.0.10,picdate-1-2机器上初始化启动VIP:10.0.0.18 ,一旦服务器picdate-1-1 或picdata-1-2任意一台机器宕机、在宕机的机器上初始化的虚拟VIP就会自动切换到运行正常的机器上、实现IP资源的自动接管、从而达到高可用无业务影响的目的。 heartbeat通过串口线或直连对服务器做健康检查、执行虚拟IP的动态切换
8.2.5 heartbeat 服务主机资源规划

名称 接口 IP 用途
Master Eth0 192.168.236.143 外网管理IP、用WAN转发数据转发
  Eth1 172.16.1.1 内网管理IP,用于LAN数据转发
  Eth2 192.168.1.1 用于提供心跳线路连接(直连)
  VIP 192.168.236.10 用于提供应用程序A挂载服务
BACKUP Eth0 192.168.236.192 外网管理IP、用WAN转发数据转发
  Eth1 172.16.1.2 内网管理IP,用于LAN数据转发
  Eth2 192.168.1.2 用于服务器间心跳连接
  VIP 192.168.236.20 用于提供应用程序A挂载服务

 
8.3 搭建heartbeat 及配置heartbeat
设置hosts文件 两台都配置 注意 这里是主机名也需要改成picadata-1-1 是主机名需要改
例如:hostname picadata-1-1 如果这步没有操作启动服务的时候会出现报错。
echo ‘172.16.1.1 picdata-1-1’>>/etc/hosts
echo ‘172.16.1.2 picdata-1-2’>>/etc/hosts
[root@Lserver-1 ~]# tail -2 /etc/hosts
172.16.1.2 picdata-1-2
172.16.1.1 picdata-1-1
8.3.3 配置服务器间心跳连接:
192.168.1.1 和192.168.1.2 两块网卡之间是通过普通网线直连连接的、即不通过交换机、直接把两块网卡连接在一起用于做心跳检测
Master:
ifconfig eth2 192.168.1.1 netmask 255.255.255.0
Backup:
ifconfig eth2 192.168.1.2 netmask 255.255.255.0
picdata-1-1 server 上添加如下主机路由
route add –host 192.168.1.2 dev eth2
####这条命令是:从picdata-1-1 server 访问192.168.1.2 走网卡eth2出去、作为心跳线路
echo ‘route add -host 192.168.1.2 dev eth2’ >>/etc/rc.local
##-à加入开机自启动配置里、这样下次启动后就会自动加载这个路由配置。
route -n
picdata-1-2 server 上添加如下主机路由
route add –host 192.168.1.2 dev eth2
####这条命令是:从picdata-1-2 server 访问192.168.1.2 走网卡eth2出去、作为心跳线路
echo ‘route add -host 192.168.1.1 dev eth2’ >>/etc/rc.local
##-à加入开机自启动配置里、这样下次启动后就会自动加载这个路由配置。
route -n
设置一下yum 保存rpm包
sed -i s/keepcache=0/keepcache=1/g /etc/yum.conf
8.4.2 配置heartbeat服务
yum install heartbeat –y
进入heartbeat 目录
cd /usr/share/doc/heartbeat-3.0.4
ll|grep ha.cf authkeys haresources
8.4.2.1配置ha.cf 文件
debugfile /var/log/ha-debug
logfile /var/log/ha-log
logfacility     local0
####-à以上三行为日志的配置、在你配置时一般不需要改动、
keepalive 2
deadtime 30
warntime 10
initdead 120
###-à以上四行为一些基础的参数、在你配置时一般不需要改动
#       serial  serialportname …
mcast eth2 225.0.0.219 694 1 0
##-à 此行表示使用多播的方式、需要改动的仅有eth2 改成你的心跳线的网卡
auto_failback on
node    picdata-1-1  ##-à两台存储server的主机名
node    picdata-1-2  ##-à两台存储server的主机名
crm     no
 
8.4.2.2配置authkeys
auth 3
#1 crc
#2 sha1 HI!
3 md5 Hello!
authkey 文件必须为600 权限。Authkey文件中已经说明了需要配置600 权限
#       Authentication file.  Must be mode 600
 
8.4.2.3 配置haresources
添加两行文件
picdata-1-1 IPaddr::192.168.236.10/24/eth0
配置说明:picdata-1-1 为主机名,表示初始化状态会picdata-1-1 绑定IP 192.168.1.1
Ipaddr 为heartbeat 配置IP的默认脚本、气候的IP等都是脚本的参数。
192.168.1.1/24/eth2 为集群对外服务的VIP 初始启动在picdata-1-1 上# 24 为子网掩码。Eth2 为ip绑定的实际物理网卡、为heartbeat提供对外服务的通信接口
# 同理192.168.1.2/24/eth2 为集群对外服务的VIP ,初始化在picdata-1-2 上、#24 为子网、eth2为ip绑定的实际网卡、为heartbeat提供对外服务的通信接口
上面修改的文件是在/usr/share/doc/heartbeat-3.0.4 里面的。我们现在把文件复制到/etc/ha.d/中
cp –p ha.cf /etc/ha.d/ha.cf
cp –p authkeys /etc/ha.d/ authkeys
cp –p haresources /etc/ha.d/ haresources
master 和 backup 启动服务
特别强调:机器名必须是uname –n 的结果 才可能启动成功。
如果启动不成功记得看日志文件的信息。
/etc/init.d/heartbeat start
Starting High-Availability services: INFO:  Resource is stopped
Done.
查看一下进程是否正常
[root@Rserver-1 ha.d]# netstat -ntlup|grep heartbeat
udp        0      0 225.0.0.1:694               0.0.0.0:*                               101265/heartbeat: w
udp        0      0 0.0.0.0:54491               0.0.0.0:*                               101265/heartbeat: w
[root@Rserver-1 ha.d]#
上面显示已经有了两个进程了。看看backup服务器的进程
[root@Lserver-1 ha.d]# netstat -ntlup|grep heartbeat
udp        0      0 225.0.0.1:694               0.0.0.0:*                               32486/heartbeat: wr
udp        0      0 0.0.0.0:48705               0.0.0.0:*                               32486/heartbeat: wr
[root@Lserver-1 ha.d]#
备份服务器中也是正常的
8.6测试heartbeat 是否成功
在mastart 中开启httpd服务首页是143 backup中也开启httpd服务首页为192
我在backup中curl 一下
[root@Lserver-1 html]# curl http://192.168.236.10
143 我再把heartbeat关闭看看
[root@Rserver-1 html]# /etc/init.d/heartbeat stop
Stopping High-Availability services: Done. 在mastart curl 查看一下
[root@Rserver-1 html]# curl http://192.168.236.10
192 已经显示了192了说明heartbeat已经成功把VIP转移了。说明已经成功了。
 
8.7双主模式的方法。
Master 和backup 都需要修改 或者你可以做成rsync+intory 的方式自动同步
[root@Rserver-1 ha.d]# egrep -v “^$|^#” haresources
Picadate-1-1 IPaddr::192.168.236.10/24/eth0
Picadate-1-2 IPaddr::192.168.236.20/24/eth0
启动一下
[root@Rserver-1 ha.d]# /etc/init.d/heartbeat stop
Stopping High-Availability services: Done.
[root@Rserver-1 ha.d]# /etc/init.d/heartbeat start
Starting High-Availability services: INFO:  Resource is stopped
INFO:  Resource is stopped
Done.
在两端查看一下ip
master :
[root@Rserver-1 ha.d]# ip addr list
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:20:dc:da brd ff:ff:ff:ff:ff:ff
inet 192.168.236.143/24 brd 192.168.236.255 scope global eth0
inet 192.168.236.10/24 brd 192.168.236.255 scope global secondary eth0  ####已经有了一个主了
inet6 fe80::20c:29ff:fe20:dcda/64 scope link
backup :
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:4d:f6:92 brd ff:ff:ff:ff:ff:ff
inet 192.168.236.192/24 brd 192.168.236.255 scope global eth0
inet 192.168.236.20/24 brd 192.168.236.255 scope global secondary eth0  ###backup中也有一个主了
inet6 fe80::20c:29ff:fe4d:f692/64 scope link
一般修改的话就是修改haresource 这个文件其他两个文件不需要修改的。
测试是否接管成功
在backup中
[root@Lserver-1 ~]# /etc/init.d/heartbeat stop
Stopping High-Availability services: Done.
在mastrt 查看查询一下
[root@Rserver-1 ha.d]# ip addr list
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:20:dc:da brd ff:ff:ff:ff:ff:ff
inet 192.168.236.143/24 brd 192.168.236.255 scope global eth0
inet 192.168.236.10/24 brd 192.168.236.255 scope global secondary eth0
inet 192.168.236.20/24 brd 192.168.236.255 scope global secondary eth0
已经接管成功了。
Heartbeat 维护思想
如果开发人员想调整heartbeat 就让对方不要动heartbeat关闭和启动
只让对方用命令行方式添加
/etc/ha.d/resource.d/IPaddr 192.168.236.30/24/eth0 start
[root@Rserver-1 ha.d]# ip addr list
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:20:dc:da brd ff:ff:ff:ff:ff:ff
inet 192.168.236.143/24 brd 192.168.236.255 scope global eth0
inet 192.168.236.10/24 brd 192.168.236.255 scope global secondary eth0
inet 192.168.236.20/24 brd 192.168.236.255 scope global secondary eth0
inet 192.168.236.30/24 brd 192.168.236.255 scope global secondary eth0
后面在把这个配置写入到配置文件中。后面到了晚上十一点之后重启一下服务就行了,设置一个脚本。设置一个定时任务就OK了。
 
 
 
 
 
8.8 分析heartbeat 日志接管过程。
我把两端的heartbeat 的服务都停掉了;把ha-log都清空了。
现在分析一下mastrt 和backup的日志
Mastrt 日志
root@Rserver-1 log]# cat ha-log
May 15 21:23:46 Rserver-1 heartbeat: [124498]: info: Pacemaker support: no
May 15 21:23:46 Rserver-1 heartbeat: [124498]: WARN: Logging daemon is disabled –enabling logging daemon is recommended
May 15 21:23:46 Rserver-1 heartbeat: [124498]: info: **************************
May 15 21:23:46 Rserver-1 heartbeat: [124498]: info: Configuration validated. Starting heartbeat 3.0.4
May 15 21:23:46 Rserver-1 heartbeat: [124499]: info: heartbeat: version 3.0.4
May 15 21:23:46 Rserver-1 heartbeat: [124499]: info: Heartbeat generation: 1494849125
May 15 21:23:46 Rserver-1 heartbeat: [124499]: info: glib: UDP multicast heartbeat started for group 225.0.0.1 port 694 interface eth2 (ttl=1 loop=0) -à告诉了我们心跳的地址和网卡。
May 15 21:23:46 Rserver-1 heartbeat: [124499]: info: G_main_add_TriggerHandler: Added signal manual handler
May 15 21:23:46 Rserver-1 heartbeat: [124499]: info: G_main_add_TriggerHandler: Added signal manual handler
May 15 21:23:46 Rserver-1 heartbeat: [124499]: info: G_main_add_SignalHandler: Added signal handler for signal 17
May 15 21:23:46 Rserver-1 heartbeat: [124499]: info: Local status now set to: ‘up’
May 15 21:24:07 Rserver-1 heartbeat: [124499]: info: Link lserver-1:eth2 up.
May 15 21:24:07 Rserver-1 heartbeat: [124499]: info: Status update for node lserver-1: status up
harc(default)[124593]:  2017/05/15_21:24:07 info: Running /etc/ha.d//rc.d/status status #检查状态
May 15 21:24:08 Rserver-1 heartbeat: [124499]: info: Comm_now_up(): updating status to active #更新状态,激活状态
May 15 21:24:08 Rserver-1 heartbeat: [124499]: info: Local status now set to: ‘active’
May 15 21:24:08 Rserver-1 heartbeat: [124499]: info: Status update for node lserver-1: status active
harc(default)[124613]:  2017/05/15_21:24:08 info: Running /etc/ha.d//rc.d/status status
backup log :
[root@Lserver-1 ~]# cat /var/log/ha-log
May 15 21:23:20 Lserver-1 heartbeat: [37229]: info: Pacemaker support: no
May 15 21:23:20 Lserver-1 heartbeat: [37229]: WARN: Logging daemon is disabled –enabling logging daemon is recommended
May 15 21:23:20 Lserver-1 heartbeat: [37229]: info: **************************
May 15 21:23:20 Lserver-1 heartbeat: [37229]: info: Configuration validated. Starting heartbeat 3.0.4
May 15 21:23:20 Lserver-1 heartbeat: [37230]: info: heartbeat: version 3.0.4
May 15 21:23:20 Lserver-1 heartbeat: [37230]: info: Heartbeat generation: 1494849124
May 15 21:23:20 Lserver-1 heartbeat: [37230]: info: glib: UDP multicast heartbeat started for group 225.0.0.1 port 694 interface eth2 (ttl=1 loop=0)
May 15 21:23:20 Lserver-1 heartbeat: [37230]: info: G_main_add_TriggerHandler: Added signal manual handler
May 15 21:23:20 Lserver-1 heartbeat: [37230]: info: G_main_add_TriggerHandler: Added signal manual handler
May 15 21:23:20 Lserver-1 heartbeat: [37230]: info: G_main_add_SignalHandler: Added signal handler for signal 17
May 15 21:23:20 Lserver-1 heartbeat: [37230]: info: Local status now set to: ‘up’
May 15 21:23:21 Lserver-1 heartbeat: [37230]: info: Link rserver-1:eth2 up.
May 15 21:23:21 Lserver-1 heartbeat: [37230]: info: Status update for node rserver-1: status active
May 15 21:23:21 Lserver-1 heartbeat: [37230]: info: Comm_now_up(): updating status to active
May 15 21:23:21 Lserver-1 heartbeat: [37230]: info: Local status now set to: ‘active’
harc(default)[37240]:   2017/05/15_21:23:21 info: Running /etc/ha.d//rc.d/status status
May 15 21:23:32 Lserver-1 heartbeat: [37230]: info: local resource transition completed.
May 15 21:23:32 Lserver-1 heartbeat: [37230]: info: Initial resource acquisition complete (T_RESOURCES(us))
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_192.168.236.20)[37295]:        2017/05/15_21:23:32 INFO:  Resource is stopped
May 15 21:23:32 Lserver-1 heartbeat: [37259]: info: Local Resource acquisition completed.
May 15 21:23:32 Lserver-1 heartbeat: [37230]: info: remote resource transition completed.
harc(default)[37378]:   2017/05/15_21:23:32 info: Running /etc/ha.d//rc.d/ip-request-resp ip-request-resp
ip-request-resp(default)[37378]:        2017/05/15_21:23:32 received ip-request-resp IPaddr::192.168.236.20/24/eth0 OK yes  ##集群转换消息
ResourceManager(default)[37401]:        2017/05/15_21:23:32 info: Acquiring resource group: lserver-1 IPaddr::192.168.236.20/24/eth0  ###启动了一个脚本,启动了VIP
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_192.168.236.20)[37429]:        2017/05/15_21:23:32 INFO:  Resource is stopped
ResourceManager(default)[37401]:        2017/05/15_21:23:32 info: Running /etc/ha.d/resource.d/IPaddr 192.168.236.20/24/eth0 start
IPaddr(IPaddr_192.168.236.20)[37554]:   2017/05/15_21:23:32 INFO: Adding inet address 192.168.236.20/24 with broadcast address 192.168.236.255 to device eth0
IPaddr(IPaddr_192.168.236.20)[37554]:   2017/05/15_21:23:32 INFO: Bringing device eth0 up
IPaddr(IPaddr_192.168.236.20)[37554]:   2017/05/15_21:23:32 INFO: /usr/libexec/heartbeat/send_arp -i 200 -r 5 -p /var/run/resource-agents/send_arp-192.168.236.20 eth0 192.168.236.20 auto not_used not_used
/usr/lib/ocf/resource.d//heartbeat/IPaddr(IPaddr_192.168.236.20)[37528]:        2017/05/15_21:23:32 INFO:  Success
[root@Lserver-1 ~]#
通过如上的分析我们可以看到启动了VIP的各种信息。如果你的日志中没有这些启动VIP的信息,那说明你的配置或者心跳线路有问题。
如果有问题的情况下。最好还是先看log日志。这样比去网上百度更有效果!!!
 

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

发表评论

电子邮件地址不会被公开。 必填项已用*标注