AIOps 一场颠覆传统运维的盛筵
787
2022-10-03
TcaplusDB运维日常:不停服的数据库升级(5)
对于一款线上游戏而言,每次停服都会对玩家活跃、用户体验、运营数据等造成一定影响,以至于大部分游戏停服升级都选择在凌晨进行。而TcaplusDB的升级可以让游戏完全不受影响照常运行,那TcaplusDB的升级是如何操作的呢?
本篇文章介绍Tcapsvr的升级,Tcapsvr为TcaplusDB的存储层,采用主备架构,升级时先升级slave,并采用灰度升级。
1. 升级注意事项
Tcapsvr的升级在TcapDB之后,在Tcaproxy升级之前;Tcapsvr的升级一定要灰度升级,按照先升级slave,升级完slave之后,等待2小时以上,再进行主备切换,再等待2小时以上,再升级切换后的slave,完成主备的全部升级
升级的过程中需要注意灰度,一般是先升级1台,在升级3台,在后面则则可以增多升级的机器数量,分批次升级完slave;
升级SVR之前同样需要上传升级包,其升级包的命名示例为TcaplusService3.51.0.201775.x86_64_release_20201124.tar.gz,SVR的升级包的版本一般要低于center的版本,
比如我们当前center的大版本为3.51.1版本,那么SVR的版本最好小于3.51.1,比如使用如上的3.51.0的版本。
SVR的升级包的上传和center的完全一致,这里不再赘述,请参考Tcapcenter安装包的上传部分;
2. 升级slave
进入“运维平台”->“事务处理”页面,找到列名为“关联名称”下面的“ProcessType:tcapsvr”这个事务,由于是刚操作,一般是最新的那条,查看升级进度;查看升级的流程,成功后,进入“集群状态”页面,查看升级版本是否符合预期;如果升级失败,表现为长时间处于红色“停止”状态,则需要查看日志或者相关运维开发人员定位,不可继续后面的升级;如果升级成功,则灰度升级剩下的备机;
3. 主备切换
灰度升级完全部的备机后,观察至少2小时后,中间无异常,则进行主备切换操作,主备切换流程参考如下
在全部完成主备切换后,此时的master的版本为升级后的版本,观察服务2小时候,则可以灰度升级切换后的slave了
TcaplusDB是腾讯出品的分布式NoSQL数据库,存储和调度的代码完全自研。具备缓存+落地融合架构、PB级存储、毫秒级时延、无损水平扩展和复杂数据结构等特性。同时具备丰富的生态、便捷的迁移、极低的运维成本和五个九高可用等特点。客户覆盖游戏、互联网、政务、金融、制造和物联网等领域。
发表评论
暂时没有评论,来抢沙发吧~