AIOps 一场颠覆传统运维的盛筵
613
2023-02-16
本文目录一览:
大学数据中心机房运维风险运维安全事件分析的识别和应对论文
无论是身处学校还是步入社会,许多人都写过论文吧,论文是探讨问题进行学术研究的一种手段。还是对论文一筹莫展吗?下面是运维安全事件分析我整理的大学数据中心机房运维风险的识别和应对论文,欢迎阅读,希望大家能够喜欢。
摘要:
高校数据中心机房作为学校重要的场所,为学校日常教学办公提供重要的网络保障。如何保障数据中心的安全,已经变得越来越重要。本文通过研究风险管理在高校数据中心机房的应用研究。以我校数据中心机房运维项目为例,进行风险管理各方面的研究。旨在提高机房管理人员管理能力,保障数据中心机房安全。
关键词:
风险识别运维安全事件分析;风险应对;数据中心机房;
引言:
数据中心机房是学校数据汇聚交互的核心场所,所有接入校园网的数据都是通过数据中心机房进行交互。信息化大背景下,高校数据中心机房为师生提供更加便捷的服务,在教学、科研、办公等方面都有体现。
近些年来,随着数字校园,智慧校园的推进,全国各高校的数据中心机房规模不断发展。“一表通系统”上线,“最多跑一次”改革,高校越来越多的业务都转到校园网上,办公流程的简化,业务流程的电子化,极大地方便了广大师生。但同时,伴随着不断增长的业务,扩增的机房设备,我们对数据中心的要求不断提升,日常的运维管理面临的风险也越来越大。
1、高校数据中心运维引入风险管理的意义
数据中心机房是全校网络的核心区域,包括服务器,IPS设备,业务系统等,是一系列硬件软件设备的总和。一般高中小学校不会涉及数据中心机房,而大学的数据中心机房则不同,需要专人管理。数据中心机房的日常维护绝不是简单的设备维修,而是一项长期且细致的工作,涉及的内容很多,包括机房设备维修,系统升级,安防检查等。因此我们需要引入一整套科学合理的管理方法来应对风险。
数据中心机房的风险管理涉及内容很多有:风险识别,风险分析,风险应对等。其中,风险识别就是识别出潜在的风险,例如:机房火灾,漏水,停电等,是风险管理中最重要的内容之一,是确定潜在风险并分析找出应对方法的前提。所以一般对于风险识别的内容,我们会花费大量的时间来收集汇总,识别中会用到的德尔菲法,头脑风暴等方法。在数据中心日常运维中,针对识别出的高风险因素,我们需要制定相关的策略,包括消极和积极2方面的风险应对策略。风险存在是必然,我们需要积极引入风险管理机制,才能在出现问题时候迅速解决。
2、数据中心机房运维的风险识别
每个项目特性是千差万别,项目独特性决定项目实施过程存在很多不确定性,尽可能识别出不确定因素,是确保项目成功的重要因素[1]。风险识别不仅是风险管理的核心部分,更是基础内容。风险识别就是运用各种科学方法,识别项目的潜在风险,识别引发潜在风险的原因以及可能引发的`后果。特点:风险识别覆盖整个项目的生命周期。项目管理过程中,需要对风险进行反复地识别。风险识别的方法很多,包括德尔菲法,头脑风暴,专家判断等。
为了尽可能全面地识别出潜在的风险,结合实际情况,对数据中心机房风险识别步骤包括3步,第一步,进行工作分解结构WBS,目的就是为了更直观地进行风险识别。第二步,风险收集,针对运维项目,需要组织人员进行现场勘查,发现存在的问题,收集数据中心的资料。针对运维现状,组织全体人员进行头脑风暴法识别潜在的风险,再利用专家调查法对收集的潜在风险进行识别。第三步,风险确认,组织相关人员进行总结分析归纳,最终得到运维项目风险登记册。
(1)工作分解结构WBS
数据中心运维项目按照一定原则进行工作分解,其目的是为了给风险识别提供依据。首先,组织运维项目的各部门的负责人员,技术人员等进行现场勘查,摸清机房现状。按照整体机房运维的思路做好地勘工作,地勘需要记录各个领域的工作,并进行工作分解。
(2)风险收集
本次运维项目的风险收集采用头脑风暴会议。在会议之前,需要收集项目相关资料,包括项目技术文件,运维记录,机房资料,合同等。然后提前将地勘记录和收集到的项目资料发给参与会议的人员,确保参会人员能提前充分了解项目内容。会议针对运维项目期间可能存在的风险,进行充分的讨论和汇总。由项目经理担任本次会议支持人,在主持人的推动下,与参会人员就项目的风险集思广益。所有参与人员均有平等发言权,对潜在的风险提出自己的观点。最后将会议的内容进行整理汇总,初步得到机房运维的风险因素。
(3)风险确认
风险确认即将收集汇总的风险因素发给专家小组,由专家小组再次确认,记录整理并完成风险识别。专家小组包括各行业专家、部门负责人等。专家小组通过了解数据中心机房运维项目的基本情况,背景等,对头脑风暴会议收集的风险因素进行多次征询,直至达成一致意见,完成项目风险识别。
最终将运维项目风险分为5类,包括设备风险,业务风险,运维管理风险,自然风险,其运维安全事件分析他风险。设备风险包含:服务器风险,IPS设备风险,环控设备风险等。业务风险包括:特大网络故障风险,一般业务故障风险,业务质量下降风险等。运维管理风险包括:团队管理风险,沟通交流风险,人员管理风险等。自然风险包括:火灾,水灾,电磁干扰等,其运维安全事件分析他风险包括:合同风险,需求变化风险,人员技术风险等。
3、数据中心机房运维的风险分析
风险分析从2方面进行,第一个是定性风险分析,定性分析是指采取一定手段,综合评估分析存在的风险概率以及它的影响程度,并对风险按风险程度排序。同时为下一步分析提供依据。本次运维项目研究所用到的分析工具有概率-影响矩阵,风险分类,专家判断法等。定性风险分析过程作用是为了降低项目的不确定性,并重点关注高优先级的风险,有利于后续针对性开展风险应对。
概率-影响矩阵(P-I矩阵)是经常使用的工具,它是针对不同程度的风险,进行分级和排序,便于下一步进行定量分析及应对。在概率-影响矩阵中,一般将横坐标和纵坐标从低到高划分为5个标准,用数值0.1、0.3、0.5、0.7、0.9表示,一共划分为25个方格,方格内数字表示风险值R,公式为R=P*I。R数值越低,概率越小,影响程度越小。R数值越高,概率越高,影响程度越大。概率高,影响程度高的区域,一般在右上角,属于高风险,需要采取重点措施,并采取积极地应对策略。概率低,影响程度低的区域,一般在左下角,属于低风险区域,一般列入待观察风险清单,一般不需要采取积极管理措施,监测即可。
第二个是定量风险分析,它是对定性分析过程中,对项目影响很大,风险等级很高的风险进行更加具体的分析。它是对风险事件的影响程度分析,一般高风险事件分配高数值,低风险分配低数值。定量风险分析的目的是为了确定重大的风险,同时提醒管理人员对高风险,进行密切关注,做好应对准备。
4、数据中心机房运维的风险应对
风险应对过程是在风险分析之后,针对存在的风险,在分析风险概率及其影响程度基础上,制定一系列措施降低风险、提高有利机会。通过科学合理的管理理论和措施,可以有效规避和降低项目风险。风险应对措施必须及时有效,并制定多种应对方式,择优选择。
风险应对方法有很多,针对已总结的风险,结合数据中心项目的具体情况制定相关的应对策略包括:风险规避,风险转移,风险预防,风险减轻。
(1)风险规避:风险规避是为了达到项目目的,改变原来计划,从而规避风险,减少风险带来的影响。如:调试项目范围,利用多种手段达到目的等。在机房检修的时候,必须秉承着不影响机房正常运行的原则。检修UPS蓄电池,进行放电时,不能影响机房正常运行。检修空调时,应该要一个一个进行检查,不能同时关闭所有机房空调,否则会影响机房正常散热,导致服务器出现故障。维护业务服务器时,必须不能影响其他业务的运行。
(2)风险转移:风险转移目的是将风险转嫁给第三方人员,包括风险的影响和责任。在数据中心机房运维中,常见的风险转移就是第三方公司维保。因为数据中心机房的重要性,所以必须保证机房7*24小时都要稳定运行。单单依靠网络中心一个部门是无法保障机房的一年365天的安全,还必须要有其他部门和第三方运维公司的配合。现在高校的数据中心机房都会有第三方公司运维,包括服务器的维保,环境监控的维保,网络安全维保等。转移工具包括合同、履约保证协议、保密协议,保证书等。通过签署合同或协议,能将风险的责任转移给第三方。
(3)风险预防:风险预防就是针对存在的风险,制定应急预案,避免风险的发生。施工或运维过程中一旦出现风险或者发现目标与预期有较大偏差时,即可按照应急方案采取相应措施。机房定期进行应急演练是必要的,针对运维情况制定不同的应急演练内容,如:特大网络故障,一般业务故障,火灾等。有利于提高运维人员对突发安全事件的响应与处置能力,保障学校机房安全、持续和稳定运行。机房内不需要的设备必须及时清理,必须建立定期检查制度,对相关设备进行详细检查[2]。
(4)风险减轻:风险减轻就是减轻风险事件所带来的影响,减低风险发生的概率。它分为两个方面,第一个是已经发生的风险,要采取积极的措施减少风险带来的影响。第二个是还没发生的风险,要采取积极措施减少发生概率。例如:在机房整理线缆时候,必须按照行业规范,进行走线,并按照统一标准添加标签,确保线材整洁。这样能减少后期维护的成本,当出现线路问题时,能在第一时间找到问题线路。此外,在机房配备UPS电源,也是为了保护服务器设备,在断电情况下能继续工作一段时间,减少服务器突然断电引发的一系列问题。
5、结语
数据中心机房承担着高校全部的信息化业务,运维内容包括服务器,IPS设备,业务系统等软硬件设备,涉及多个部门和第三方运维公司。因此,高校数据中心机房运维是一个长期、复杂的项目,需要持续性地管理。
风险管理作为一种科学的管理手段,在数据中心机房的运维中的应用有着重要的意义,通过风险管理研究,识别、分析和应对等,我们可以清晰地了解整个运维项目存在的风险。识别潜在风险,通过科学的风险分析手段,应对不同程度的风险。
参考文献
[1]郑渝莎.浅谈通信机房搬迁项目的风险管理[J].江西建材,2017(13):261+263.
[2]王欣.信息机房运维及其管理的主要策略分析[J].计算机产品与流通,2020(01):131.
;重点考虑如下几个方面的内容:
1、安全资源的统一管理
安全策略是企业安全建设的指导性纲领。信息安全管理产品应能在安全策略的指导下,对与信息安全密切相关的各种资产进行全面的管理,包括网络安全设备产品,重要的网络资源设备服务器或网络设备,以及操作系统和应用系统等。要实现关键防护设备的健壮性检查工作。
2、安全管理可视化
实现安全运维管理服务流程的可视化、结果可跟踪、过程可管理,支持完善的拓扑表达方式,支持可视化的设备管理、策略管理和部署,支持安全事件在网络逻辑拓扑图中显示。信息安全全景关联可视化展示方法和技术,从信息展示逻辑和操作方式上提高可视化的视觉效果,增强系统的易用性和信息的直观性。
3、信息安全全景关联模型及方法
各种类型、不同厂家的安全设备得以大规模使用,产生难以手工处理的海量安全信息,如何统一监控、处理这些不同类型的安全信息,如何从这些海量的安全信息中整理、分析出真正对用户有价值的安全事件。
通过设计一个基于关联的信息安全事件管理框架,实现安全信息的关联及关联后事件表示,实现安全信息精简、降低误报率和漏报率以及改进报警语义描述,达到增强安全系统间的联系、建立安全信息管理标准、提供安全可视化描述和建立安全通用处理流程。支持安全检测模式深度挖掘。
4、信息安全态势评估模型和态势评估方法
安全综合评价以及安全态势预测的最终目的是建立大型网络的宏观、统一的安全态势评估体系,提供网络安全策略、进行宏观态势评估及预测的技术手段,达到全面评价系统整体安全性的目的,为实施网络安全管理策略制定提供决策支持的工具。
5、海量数据存储和高性能处理机制
建立基于网格技术的分布式存储和分布式处理机制,通过网格中间件既可以实现数据的分布式存储,又可以将统一的数据库查询请求变成在各网格节点进行的分布式查询,以提高数据库操作效率,从而通过计算规模扩展实现数据存储和处理性能的提升。
这个问题问的还是很有意思的运维安全事件分析,也是热点问题吧。如果微信被运维删库跑路的话,会造成什么样的结果呢,其它微信就简单的多了,它无这不微盟那么复杂,因为微盟是有更多客户数据的,结果也不太一样,因为它的服务对像并不多,也只是300万,但是数据量反而非常大,所以删库的影响反而更大了,微信被删库的话,结果会是这样的。
怎么我的微信登不上去?这是最为常见的。客户基本信息数据丢失了,微信会登不上去,使用手机号登录可能还会提升,没有注册过呢。这个影响是最大的,就是微信数据丢失了,啥啥都没有了。
再有的就是部分数据库的无法使用,比如有微信,可登录,但是好友没有了,朋友圈的数据没有了,备注的用户名没有了,等等,这个是一些相对影响小一点儿的。另外微信因为用户比较大,所以它的用户数据存储应该是分散式的,相对微盟这样的相对集中式管理还是不太一样的,个人认为了,具体的只有腾讯的工程师知道他们的数据存储方式了。
最后就是最恐怖了,那就是微信它有一个钱包账户,里面是有钱的,如果用户的账户信息缺失的话,可能会造成巨大的钱财无户主,想想看,你的钱是不是没有什么保障呢?所以钱最好还是不要放到微信里面好呀。
你好,很负责任的告诉你这种情况几乎不可能发生。
我们从如何删库的方式来分析下运维安全事件分析:
1.SQL清除数据库
企业一般情况下只有开发人员或DBA(数据库管理员)有权限通过SQL操作数据库。 基于数据的重要性,企业一般都有严格的权限限制及SQL审核机制,对操作人员的执行的SQL进行审查,粒度可以精确到执行时间长短、删除等危险性操作、数据查询结果量等,凡是匹配相应的策略,平台将会拒绝执行此类操作。 因此通过SQL达到删库是不可能的。
2.操作系统级别格式化或删除
操作系统级别的格式化或删除一般只有系统管理员有权限执行,但是以目前的自动化水平, 服务器的交付已经完全可以脱离系统管理员手动操作 ,从而有效的避免了人为操作引起的事故。另外, 系统管理员也都不是直接操作服务器,而是基于堡垒机操作,堡垒机已经对用户权限、目录、删除操作都做了限制,因此也无法做到删库的目的。
虽然,我们在网上偶尔听说某某公司程序员删库跑路,这其实都可以通过技术手段来避免,像腾讯、阿里、百度这样的大厂对删库这样的危险动作,肯定都是做了十足的防范,这种事情的发生的概率比中彩票还难。
最后, 企业的数据库都有高可用架构、异地容灾、完善的数据库备份计划,甚至还时长会对故障进行演练,因此即使发生数据库被删,也能够通过一些列手段将数据找回。
综上所述,微信被运维删库、跑路,用户感知的后果应该会是暂时登陆不了,不会有什么其他大的问题。不过,鉴于微信的流量,最终后果还得看吃瓜群众的反应。
刺激运维安全事件分析!!!
删库最直接的影响就是能会导致系统瞬间崩溃,所有相关功能瘫痪,然后就是公司无法估计的经济损失。业务停摆、股票暴跌、市值下降再到后续的信任危机、对家抢单等等等等。
反正就是,严重的就像是微盟的下场,可能他们也没想到,一个女人能引发这么大的“ 血案 ”。
删库被称为程序员最后的底裤!!!是程序员最后的倔强!!!
一般来说,程序员还都是比较讲理的,但总有一些“大老板”不断地挑战小哥哥的底线,不管是从精神上还是物质上,不断地压榨小哥哥们,最后导致了悲剧的发生...
毕竟,删库简单,跑路难,删库的程序员都是抱着同归于尽的想法来进行的删库,在现在进行跑路实在是太难了,所以你放心,你只要不过分的欺负你的宝贝程序员他是不会轻易做出这么危险的事情的。
要说最轰轰烈烈的删库事件应该就是微盟的删库事件了,瞬间将rm-rf的身价狂抬到30亿短短的五个字符价值竟达到了30亿。
事件的起末应该就不用我多说了!!!大家肯定都已经懂已经知道了!!!
要想生活过的去,头上必须带点绿。
我还是简单的叙述一下吧!
某某员工不管被自己的老板绿了,然后还被威胁要辞退他,他的女朋友去帮他说情,然后这个可怜的小哥哥又被绿了。
愤怒之下的他,打算像个男人一样!站起来!
然后他就删库了,但是他没能跑路...
所以说小哥哥们要多注意锻炼身体,要不然你删库完都跑不了,就做好同归于尽的准备!!!
一定会有人问,那微盟这么大的公司没备份吗???
不好意思嗷,备份也被删库了。
这说明了一个很大的问题,备份不要只有一个,多个备份要分到不同的人手中管。
也不排除团队删库跑路哈,那估计真的是仇恨值爆表了!
剩下的小事件还有...
思科前员工在2016年7月到2018年4月任职期间,恶意删除思科四百多台虚拟机,造成16000个WebEx Teams账户被异常关闭。思科因此被客户退款超过100万美元,其损失共计240万美元。
2018年9月,顺丰一位高级工程师在升级系统数据库时,不慎将RUSS数据库删除,导致了顺丰线上发车功能约10小时无法使用,负面影响严重。最后该程序员被辞退,也被“跑路”了。
2017年9月,广西某大型IT企业为客户进行扩容割接时,误操作将HSS设备里面的用户数据格式化删除,导致该运营商近80万用户数据丢失从而无法通话和上网,波及七八个地市,事故重大。
还有好多,类似的事件。
要想安安心心的杜绝此类事件,还是要有待员工,不要让他们铤而走险。
怕删库,先容灾,再备份!
有关容灾备份的解决方案可以去云掣官网看, https://www.dtstack.com/dtsmart/#tt
如果微信被运维删库、跑路,会造成什么恐怖的后果?你怎么看? 最近微盟公司因为员工和公司之间的矛盾,于是员工怒删微盟公司数据库导致了公司SaaS业务崩溃、基于微盟的商家小程序处于不能运行状态,300万商家商家生意停摆。并且还导致了微盟集团在港市值蒸发10亿,搞得是沸沸扬扬。
这次数据被删造成了微盟公司信誉的重大损失,到目前微盟公司的数据库还没有恢复,最新的消息是要到2月28日24时才能完全恢复,也就是说这一下竟然有差不多四五天时间基于微盟数据库的300万商家小程序不能正常运行,会带来相当大的损失。本来现在生意就难做,再加上小程序还不能使用,更是雪上加霜。
微盟公司与腾讯相比可以说体量完全不一样,即使微信的用户数量就达到了10亿级别,与300万用户数相比完全不是一个级别。况且还有几亿商家基于微信开发的各种各样的应用等等。如果微信发生数据库删除的情况,可以说会对微信会造成几乎整个 社会 一片愤怒,而不是像微盟那样单单300万商家。
微信里面不但有个人、群之间的聊天这么简单,即使是基于微信作为营销阵地的各种团队、个人将会是哀嚎一片。有基于微信做得各种各样的应用、小程序、个人财富等等,给个人和商家财富的损失比如零钱、理财等,会给腾讯带来数不清的官司、几千上亿商家业务的崩毁,这给腾讯带来几乎毁灭性的打击。
如果微信不能保证安全,那么其对手必然会加大对微信用户的吸收,到后来微信也许就会逐渐凋零步入小众,也许人手一个微信的将会变成人手一个支付宝。没有了微信这个平台腾讯将会失掉收割的臂膀,腾讯的业务会随着微信的凋落,也将一步一步走向平庸。
不过这一切都是假设,像腾讯公司微信这么大体量的业务,已经做好了万全的备份策略,即使是删除掉某些内容,很快也会恢复回来。
一个运维就想把微信删库?那是不可能的!
只能说非专业人士,对微信这个规模的系统一无所知,对运维的概念还挺停留在小网站的层面。
用户数据是微信得以生存的基础,一旦微信用户数据被删除,可想而知,微信的发展到底会受到什么样的掣肘,甚至于微信可能会陷入到“生死存亡”的关键时刻,怎么样的信任危机呢?
但是,我们的担心有多多余呢?其实,我们得知道的是,腾讯的数据库——
腾讯贵安七星数据中心的表现出色,更兼具安全性。
除此之外,腾讯江宁数据中心,上海数据中心等等,以及腾讯贵安七星数据中心等等,都让腾讯的数据库分散四处,且进行多种备份。
除此之外,用户管理这种绝密的数据,是在腾讯中心进行管理的,并且大量删除数据权限需要多人授权,单个人删除腾讯数据几乎可能为0!
这还用想?阿里钉钉立马趁火打劫推出普适版啊~只要微信一黑,阿里内部给钉钉的预算绝对是“无上限”级别。
当然这都是后话,人家托尼马也不是吃素的,自家的社交命脉,没那么脆弱,对于用户数据那都是多套备份,无缝衔接,就和酒店停电,地下室的发电机会立马启动一个道理。而微信有这个权利把所有备份删光的除非托尼马暗示张小龙花一定的时间才能做到完全删库
听说IT运维人员学的第一课就是“从删库到跑路”,虽然这是一句玩笑话,但是在一些不是很规范的IT企业,IT运维的很多操作都是在线的,一不小心就会给企业的数据库带来灾难性的后果,万一没有备份,客户的数据都找不回来了,那么企业多半也就黄了,有的甚至还要向客户赔偿经济损失。
所以IT企业运营有一个重要的环节就是备份,正规的企业都会有多种备份方式,比如异地备份、云端备份等。而且正规企业的IT运维人员不止一个,每个运维都有不同的权限。能够访问数据的运维一般都没有操作备份数据的权限,为的就是避免一个运维“精神失常”,把数据和备份一锅端了。
而腾讯是IT企业中的龙头老大,规章制度和备份机制肯定是最完善的。所以如果微信被运维删库、跑路了,那么肯定会有其他运维第一时间顶替对方的工作,然后通过备份来恢复数据。这种情况下,微信可能会出现无法登陆、不能发消息、不能打开公众号、小程序等故障,持续的时间则由运维人员恢复数据的速度来决定。
一般来说,只要保存数据的服务器没有遭受物理损坏,通过普通方式删除掉的数据基本上都是可以恢复,即使数据库完全被清空了,备份也没有了,也可以通过恢复硬盘的方式来找回数据。只不过速度有些慢而已。比如这次事件当中被删除的微盟就已经宣布:已经全面找回数据,并将于3月2日晚上10点到3月3日上午9点,正式进行恢复上线。
至于微信的用户数量上10亿,所以涉及到的数据和备份也达到了一个天量的数级,因此微信的数据库很有可能不是由一个运维人员来掌握的,而是分成几个甚至几百个部分,由不同的运维分开控制,每个运维的权限也不一样,互相不能访问。甚至每份数据都保存在不同的地点。这样一来,就算其中一个运维删库跑路了,影响到微信的可能也是数据库中的一个很小的部分,不会影响到整体。比如某一个用户数据库被删掉了,可能就只会导致十几万或者上百万的微信用户无法正常登陆,但其余大部分用户可能压根感觉不到有什么影响。
另外,微信的聊天数据并没有被保存在服务器上,而是保存在用户的手机里。所以就算微信被删库了,用户的聊天记录也不受影响,只要用户保证手机中的聊天记录不被删除就可以了。反过来如果手机中的聊天记录删除了,基本上就没有找回的方法了。
总而言之,微信的数据肯定有一个严密、安全的保护方式,而且有非常稳妥有效的数据恢复方案。所以就算有运维把他所负责的微信数据库删除了,可能对微信整体也无法造成太大的影响。那种被运维删库后就找不回数据的情况,通常只会发生在不怎么规范的中小型企业身上。
首先要明确,删是删不动的,就算一时能删除,也很快能找出备份恢复,所以恐怖后果不太可能,短期出现一些波动震荡就正常。
因为造不出什么恶劣后果,所以跑路真没必要,除非他能够从中获取到重大的经济利益。
可能吗?
这种可能性极大。收到竞争对手重金贿赂违法反职业道德是一种,或者因为腾讯是上市公司,重金高杠杆期货做空也是一种。
用户数据是微信得以生存的基础。
区区一个两个运维对微信能造成的伤害极小,一时删档,迅速恢复,就如大河里的一朵浪花,起不到多大作用,但要预防有恶意者结合政治经济形势下做出的联动,那样有可能造成恐怖的后果。
比如结合前段时间国家对互联网超大企业“二选一”规则的限制,腾讯的股价本身就在暴跌中,那时的百上加斤就最可怕。
单纯的理工男的泄愤行为,对微信这颗大树的影响微乎其微,基本可以忽略不计。
运维能对微信造成的伤害极其有限,并且也有时间局限
微信的数据有一个严密、安全的保护方式,而且有非常稳妥有效的数据恢复方案。所以就算有运维把他所负责的微信数据库删除了,可能对微信整体也无法造成太大的影响。那种被运维删库后就找不回数据的情况,通常只会发生在不怎么规范的中小型企业身上。
以阿里巴巴为例,你要想全部删除,至少需要150个左右完全不同小组的最高权限。
由于微信的用户数量上10亿,涉及到的数据和备份也达到天量,因此微信的数据库也不是由一个运维人员来掌握的,而是分成几个甚至几百个部分,由不同的运维分开控制,每个运维的权限也不一样,互相不能访问,甚至每份数据都保存在不同的地点。
这样一来,就算其中一个运维删库跑路了,影响到微信的可能也是数据库中的一个很小的部分,不会影响到整体。比如某一个用户数据库被删掉了,可能就只会导致十几万或者上百万的微信用户无法正常登陆,但其余大部分用户可能压根感觉不到有什么影响。
而且一般来说,只要保存数据的服务器没有遭受物理损坏,通过普通方式删除掉的数据基本上都是可以恢复,即使数据库完全被清空了,备份也没有了,也可以通过恢复硬盘的方式来找回数据。只不过速度有些慢而已。
当然微信里面不但有个人、群之间的聊天这么简单,有基于微信做的各种各样的应用、小程序、个人财富等等,那些基于微信作为营销阵地的各种团队、个人将会是哀嚎一片。给个人和商家财富的损失比如零钱、理财等,会给腾讯带来数不清的官司、几千上亿商家业务的损失,以及无形商誉和品牌名声上的质疑。
这些都会给微信带来一定的纠纷和麻烦,但是只要恢复速度够快,微信的体量也大,还是能够轻易消化这些纠纷和损失的。
若是竞争对手打击必然配合有系统整套的计划
因此,就要预防在战争或者非常情况下竞争对手精密部署,做出恶意的系统性计划来。
近年的几个案例可以作为分析警醒。
微盟公司因为员工和公司之间的矛盾,于是员工怒删微盟公司数据库导致了公司SaaS业务崩溃、基于微盟的商家小程序处于不能运行状态,300万商家商家生意停摆。并且还导致了微盟集团在港市值蒸发10亿,搞得是沸沸扬扬。
这个是规模小,删除成功了,而且备份系统不够强大,恢复时间有点长,这种威胁对微信来说可以轻松应对。
2018年9月,顺丰一位高级工程师在升级系统数据库时,不慎将RUSS数据库删除,导致了顺丰线上发车功能约10小时无法使用,负面影响严重。最后该程序员被辞退。
顺丰数据库规模够大,这位高级工程师已经身处核心,也造成了严重后果,顺丰花了10小时恢复,可见运维这种行为能影响大型互联网企业的时间是很短的,关键是因之衍生出来的各种 社会 影响和负面影响才是要紧。
思科前员工在2016年7月到2018年4月任职期间,恶意删除思科四百多台虚拟机,造成16000个WebEx Teams账户被异常关闭。思科因此被客户退款超过100万美元,其损失共计240万美元。
这个案例造成的影响是由客户直接反应回来的,正如蚂蚁延缓上市,阿里巴巴美股投资者起诉阿里巴巴一样,配合上政策性因素以及市场放大反应,那才是真正致命的东西。
至于微信可能会出现无法登陆、不能发消息、不能打开公众号、小程序等故障,持续的时间则由运维人员恢复数据的速度来决定。这些只是事件的原点,能放大到多少倍要看市场的反应和当时的环境,以及有没有被恶意设计。
在疫情肆虐的如今,金融投资者的心态已经没有以前那样平和理智,这无疑也会提供一定的加成放大因素。
删库最直接的影响就是能会导致系统瞬间崩溃,所有相关功能瘫痪,然后就是公司无法估计的经济损失。业务停摆、股票暴跌、市值下降再到后续的信任危机、对家抢单等等等等。
另外出现这样重大的安全和管理漏洞,也会引发市场对腾讯管理经营水平的怀疑,从而大幅动摇投资者对上市公司高昂股价的信心。
单一因素并不可怕,要预防竞争对手甚至敌对国家组合所有因素的重磅一击。
若是个人行为必然伴随重大的经济利益
干什么事情都要讲经济利益的。
IT企业运营有一个重要的环节就是备份,正规的企业都会有多种备份方式,比如异地备份、云端备份等。而且正规企业的IT运维人员不止一个,每个运维都有不同的权限。能够访问数据的运维一般都没有操作备份数据的权限,为的就是避免一个运维“精神失常”,把数据和备份一锅端了。
作为一个无论清醒理智还是不理智的运维,基础的专业知识都是存在的,既然知道短期删除对微信造不成实质伤害,还是要做,必然有其深刻现实的原因。
他为什么要删掉跑路,定然牵涉到重大的经济利益,而且知道数据可以恢复,导致东窗事发,只有一走了之。
连续近期政策性因素影响的大跌后,阿里、腾讯、京东、美团互联网四巨头股价最终迎来回升。港股方面,阿里巴巴涨3.14%,腾讯控股涨5.44%,京东涨8%,美团涨7.9%。其中,腾讯最新市值55687.27亿港元继续超过阿里,位居港股市值第一的宝座。
这样巨大的五万亿市值,一个波动,就能造就无数个千万甚至亿万富翁。
因删档造成的短期腾讯的股价大幅下降,存在资本市场大幅做空获利的巨大空间,这应该是才是运维奋不顾身的原因。
不过说实话,世界早已过了单打独斗个人英雄的时代,个别运维如果不结合时势,只不过是蚂蚁撼树,终究无可奈何。
综上所述,理工男单纯的意气删除,对微信的伤害其实是微乎其微的,但是在国际环境、政策变化、竞争对手、甚至敌对国家组合各种因素,也抓住有利时机的情况下才有可能造成恐怖效果,这个值得微信运营警惕深思防范。
一帮子不审题就答题的人,题主问的是如果被删会怎么样,而不是微信会不会发生删库的事情。
发表评论
暂时没有评论,来抢沙发吧~