AIOps 一场颠覆传统运维的盛筵
894
2022-10-04
运维万级数据库规模及双中心构建
嘉宾介绍
采访详情
Q这次小编非常开心请到同程旅行的张充老师来到3306π北京场,和大家聊聊如何运维万级规模数据库实例以及双中心方面内容,请问张老师为什么会分享这次的主题呢?A非常开心来到3306π北京场,我从业数据库已经13年有余,经历了不同规模数据库体量的企业,个人感受到了理想和骨感的实际差距。同时很多知名企业已经从原来关注DBA的技术深度逐渐转变到DBA项目经历及维护经验的实操能力,所以想接着本次宝贵的机会,和大家分享一些自己的亲身经历,帮助大家少走一些弯路。
Q确实如此很多公司更关注实战经验了,小编会有个小小好奇,张老师的经历和经验都很丰富,您觉得运维万级规模数据库和运维规模较小的规模数据库,两者对比最明显的区别是什么呢?A很多朋友、甚至公司会有这么一种认识:“运维小规模的数据库人员,很难维护大规模数据库;运维大规模的数据库人才反而能掌握小规模数据库的公司,所以运维大规模代表了DBA的一种能力体现”。其实这个说法比较理想,大规模的运维体系一定伴随着自动化平台的完善以便于DBA操作,但久而久之DBA会在充斥着各种平台、自动化的环境中逐渐丧失“精而细腻”的运维数据库能力,就像高数微积分一样,太久不用的话就会忘记很快,其实很多有着大规模运维经验的DBA,反而无法运维小规模的数据库了。
Q既然如此那张老师为什么还会主张分享万级数据库规模相关内容呢?A哈哈,因为这次我想和大家分享的不是理论知识或者理想的架构设计,而是真实个人所经历的运维、项目总结,本次也会和大家聊聊在万级数据库规模下,我们从0到1的去设计、建设了同程双中心的真实经历。
Q相信在设计和搭建双中心方面张老师也一定遇到了不少的挑战,您能否提前和朋友们分享一两个您觉得很有价值环节的经验吗?A双中心的话题我和很多朋友都有聊过,不少朋友会告诉我如何如何搭建才能实现。真实接触搭建双中心的朋友反而会关注其他另外的两个问题,1.搭建之前我们要确保搭建双中心的方向正确性, 2. 我们确保搭建完的双中心可以真实的达到预期的效果。和大家举例说明一个环节,如何验收双中心呢?“断网演练”一定是一个选择度很高的方案,但不少朋友会在“断网演练”里面临暴雷的危机,因为断网会造成业务有损、数据丢失等现象,并且在断网演练之前,我们有一事情必须要先保证,那就是要先保证一个中心的业务能正常服务,其次才会依赖断网进行验收,不然业务可能会面临重大的故障。这次分享中我也会多和大家聊聊这里面的盲区。
Q在万级数据库规模下的双中心方案也一定面临巨大的成本问题,张老师是如何考虑这个问题的呢?A小编的关注点果然很专业,确实如此,这个问题是每位真实做双中心的朋友们一定会面临的问题,首先我们要明确知道双中心目的战略目标是什么,什么业务或者产品线要做双中心,什么业务或者产品线不需要做双中心,这个在万级规模的数据库公司中,基本不是DBA主导去决定的,而是要业务去决定,业务决定后再确认需要做双中心的应用服务或者依赖组件,最后再对齐下游依赖的数据库,从战略目标向下对齐业务,再继续向下对齐,数据库也不是对齐的最后一环,因为数据库还有下游服务,例如数据抽取。只有梳理完整条链路,才能更准确的去评估双中心成本。
关于「3306π」社区
围绕 MySQL 核心技术,将互联网行业中最重要的数据化解决方案带到传统行业中;囊括其他开源技术RadonDB、ClickHouse、Redis、MongoDB、Hbase、Hadoop、ElasticSearch、Storm、Spark等;分享干货知识,即便是赞助商,也要求如此,拒绝放水
发表评论
暂时没有评论,来抢沙发吧~