AIOps 一场颠覆传统运维的盛筵
663
2023-02-16
本文目录一览:
事情经过
2020年2月23日18时56分许,微盟核心运维贺某酒后因生活不如意、无力偿还网贷等个人原因,在其暂住地上海市宝山区逸仙路XXX弄XXX号XXX室,通过电脑连接公司VPN、登录公司服务器后执行删除任务,将微盟服务器内数据全部删除,导致微盟自2020年2月23日19时起瘫痪,300余万用户(其中付费用户7万余户)无法正常使用该公司 SaaS 产品。(上述来源:中国裁判文书网)
2月25日,我们紧急恢复了核心业务的线上生产环境,新用户使用不受影响,并提供老用户临时过渡方案,确保商家在数据暂时没有恢复的情况下可以正常经营。
2月28日,我们恢复了所有业务的线上生产环境,并且开放了老用户登录,以及恢复了微站产品的所有数据。
截止到3月1日晚8点,在腾讯云团队协助下,经过7*24小时的努力,我们数据已经全面找回,由于此次数据量规模非常大,为了保证数据一致性和线上体验,我们将于3月2日凌晨2点进行系统上线演练,将于3月3日上午9点数据恢复正式上线。
此次事故给商家经营造成了严重的影响,公司管理层对此深感自责和愧疚,我们准备了1.5亿元人民币赔付拨备金,其中公司承担1亿元,管理层承担5000万元。在紧抓数据恢复的同时,也在同步研究商家赔付方案,我们拟定了现金赔付计划和流量赔付计划供商家选择。
同时此次事故也暴露出公司在数据安全方面出现了管理漏洞。事故发生后,我们加强了内部流程控制管理,同时邀请外部数据安全专家一起来评估数据安全保障方案,并迅速制定了一份数据安全保障计划,以杜绝此类事故的再次发生。
赔付计划
此次事故给商家经营造成了严重的影响,公司管理层对此深感自责和愧疚。事故发生后,公司管理层在紧抓数据恢复的同时,也在同步研究商家赔付方案。
首先针对此次赔付计划,我们准备了1.5亿元人民币赔付拨备金,其中公司承担1亿元,管理层承担5000万元。其中公司董事会主席兼首席执行官孙涛勇承担3500万元,公司执行董事兼首席技术官黄骏伟承担500万元,公司执行董事兼智慧商业事业群总裁方桐舒承担500万元,公司执行董事兼智慧营销事业群总裁游凤椿承担500万元。
其次整个赔付方案中,我们既要考虑商家因系统不可用而造成的利润损失,同时也要考虑系统不可用而带来的流量损失,因此我们的赔付计划做了两个不同的方案供商家任选其一。
01
现金赔付计划
我们会针对因系统不可用期间商家边际贡献利润额进行赔付,具体公式计算如下:
边际贡献利润额=日均收入×行业平均边际贡献利润率×系统故障时间
(其中日均收入等于该商家在2020年2月17日晚7点至2020年2月23日晚7点在微盟系统中产生的实际成交额除税后的平均值;边际贡献利润率是指在收入(不含税)基础上扣除商品成本、仓储及物流费及推广费、销售佣金等与商品服务销售及交付过程直接相关的费用之后的边际贡献利润占收入的比例;行业边际贡献利润率最终参考值将以研究机构公开报告为准;系统故障时间自2月23日晚7点至3月3日上午9点)
02
流量赔付计划
我们会针对因系统不可用期间的商家给予腾讯广告50000曝光次数进行流量补偿,并且提供账户运营服务,同时再延长SaaS服务有效期两个月。
(其中腾讯广告包括微信朋友圈广告、微信公众号广告、小程序广告等;曝光次数是指该广告被用户看到的次数;运营服务包含广告的创意策划、素材制作、投放执行、数据分析、账户优化、数据报表等运营服务)
最后我们所有的赔付将通过线上赔付系统完成,公司将在接下来一个月左右开发完成线上赔付系统,届时商家可通过登录微盟商户后台,点击申请赔付即可完成。
数据安全保障计划
此次事故暴露出公司在数据安全方面出现了管理漏洞。事故发生后,我们内部在系统自查的同时邀请外部数据安全专家一起来评估数据安全保障方案,现公布措施如下:
措施一:数据安全管理机制全面加固与整改,加强运维平台治理
1、完善数据安全管理制度(涵盖权限、监控、审计方面),严格执行授权审批制度;
2、使用腾讯云CAM权限系统进行云资源管理,严格执行分级授权和最小集权限制度,对高危险动作执行二次授权制度;
3、建立科学、高效、安全的网络策略,对开发环境、测试环境和生产环境进行严格隔离;使用腾讯云堡垒机替换自建堡垒机,进行细粒度权限分级和授权管理,同时严格审计堡垒机操作日志,发送安全审计报表;
4、加强运维安全流程学习,职业道德学习,法律学习等。
措施二:加强灾备体系的建设,做到多云异地冷备1、建立多云灾备体系,在北京、上海、南京等地区建立全备份的冷备系统架构;2、借助腾讯云的IAAS的底层服务能力,建立高可用的同城双活架构;3、云上所有的云主机,启用每天的快照策略,保证全量和增量备份;4、所有非结构化数据,使用腾讯COS对象存储系统进行归档保存,启用COS的多异地复制功能,数据存放多地,并且COS冷存储,确保数据只增不减;5、建立月、季度级别的定期演练机制和制度
。
措施三:基础设施全力上云1、借助腾讯云数据库MySQL的数据高可用和安全体系,逐步放弃自建数据库服务,迁移到腾讯云数据库(CDB),快速具备数据库跨可用区和异地灾备的能力;2、黑石1.0物理机全面升级黑石2.0,全面使用云主机。
法院判决
2020年9月,上海市宝山区人民法院认为,贺某行为违反国家规定,删除计算机信息系统中存储的数据,造成特别严重的后果,其行为已构成破坏计算机信息系统罪,应当依法追究刑事责任。公诉机关指控的犯罪事实清楚,证据确实充分,罪名成立。
贺某如实供述自己的罪行,认罪认罚,可依法从轻处罚。辩护人的相关意见本院予以采纳。依照《中华人民共和国刑法》第二百八十六条第二款、第六十七条第三款、第六十四条、《中华人民共和国刑事诉讼法》第十五条之规定,判决如下:
一、贺某犯破坏计算机信息系统罪,判处有期徒刑六年。(刑期从判决执行之日起计算。判决执行以前先行羁押的,羁押一日折抵刑期一日,即自2020年2月24日起至2026年2月23日止。)
二、作案工具笔记本电脑一台依法没收。
运维会比较累一点,去了人员紧张的公司,小一点的公司,把一个人当好几个人用,那你的体力就容易透支。
对于初创公司,运维部和系统部一般是合二为一的,相关工作由同一批人负责,界限可能不是很明显。大型公司对运维工作的要求更高,需要有更精细的分工,因此机房/网络/操作系统相关的底层工作分离出来由专人负责;
成为系统管理部,而上层和应用产品相关的工作则由运维负责,成为运维部。以下从互联网产品生命周期和运维涉及的技术分别来看分工较细的大型互联网公司中运维工作的职责。
扩展资料:
从行业角度来看,随着中国互联网的高速发展、网站规模越来越来大、架构越来越复杂,对专职网站运维工程师、网站架构师的要求会越来越急迫,特别是对有经验的优秀运维人才需求量大,而且是越老越值钱。
从个人角度,运维工程师技术含量及要求会越来越高,同时也是对公司应用、架构最了解最熟悉的人、越来越得到重视。
互联网运维是一个融合多学科(网络、系统、开发、安全、应用架构、存储等)的综合性技术岗位,给运维工程师提供了一个很好的个人能力与技术的发展空间。
不存在的同学
2013年4月25日周四,我永远不会忘记那一天,以及只存在于我记忆里的那位同学,潘博文。
我写出来的这些事情,可能没有几个人会相信,包括家里人和朋友,他们说我因为学习压力受了刺激,甚至怀疑我精分,以至于高考后的一段时间,我都在对现实的深深怀疑中度过。
我是天津塘沽人,从小在海河边长大,当下作为沪漂在上海某互联网公司搞运维,过着995而索然无味的生活。今天8月18号,正好是我记忆中潘博文的生日,便来倾诉一下。
天津海河河畔
我高中在塘沽某以素质教育而闻名的中学,天津高考的竞争并不是太激烈,所以大家高三时没有太大的压力,那天距离高考还有43天,上午第四节课是高三的最后一节体育课,五一假期后课表还要做调整。
我们的体育课是走班上的,每个人可以选择诸如篮球瑜伽武术等项目,所以在自己的项目里会遇到其它班的同学。
我的项目是羽毛球,老师姓金,他和学生们最能打成一片,通晓日语和摄影,还是《游戏王》的铁杆粉丝。当天金老师跟我们说了几句道别的话,又录了一段高考加油的视频,就让我们解散自由活动了。一部分女生选择回教室复习,也有带羽毛球拍的留下来打球,毕竟高三遇上这样忙里偷闲的时光不容易。我也带羽毛球拍了,准备和同班的同学小温来一局,如果我能回到那一天,一定会狠狠抽自己一顿,然后回教室上自习。
一开始我们在甬道上打球,没十分钟觉得太晒,就准备找个阴凉地继续打,然后就走到了宿舍楼的前面,宿舍楼和食堂连在一起,自从全面走读之后很久没有住人了,10班的L君和潘博文在宿舍过道的树荫下打得正酣。
潘博文是我初中同学,初中在3班,都是英语课代表。L君就是潘博文介绍我们认识的。我们简单聊了几句,然后我和同学小温打,L君和博文继续打。后来小温嫌我手劲儿太大,换成我和博文打,L君和小温打。
后来博文把羽毛球打歪了,球歪着掉进了宿舍地下室露出地表的换气窗里面,主要是因为买了YONEX的专业用球,一个球就顶我早中的饭费了, 我做出了至今懊悔的决定——去捡球。
很多地下室都有这种半露在外面的换气窗
要捡球首先得进到宿舍楼里去,我们一开始不抱太大希望,但鬼使神差地那天楼门并没有上锁(平时都是用锁封死的),用手一推就开,里面一股凉风和发霉的味道扑面而来,潘博文主动提出去捡球,我也一口答应进去,L君比较好事儿一块跟过来,最后留下小温给我们看球拍。
推门进去就是一堵墙,墙上写着住宿规定,落款是03年,往左走就是一楼的宿舍,都是老式的木门,虚掩着。尽头是个洗漱间,弥漫着一种类似氨水的味道,楼梯间在一个阴暗的角落里。
进到楼梯间,里面不是很黑,正午的阳光正好能照进来。只是往下走的楼梯横七竖八地堆了课桌椅,看了有点发怵,我跟他俩说要不然不捡了,L君跟我说来都来了,他比较瘦,身子轻便,直接翻了过去,我就跟着绕过去,顺便给潘拉了把手,我们仨沿着没有护栏的水泥楼梯一直往下走,堆得东西多,花了大概一刻钟。
下到一半是个水泥平台,具体有啥也忘得差不多了,就记得地下一层还有往下的路,但是被好几个锁封上了,外围是个大厅,有个敞开的小门连着走廊,门的尽头有亮光。我们准备往前走,潘博文突然说他的钥匙掉在楼梯上了,要回去拿,我发觉有亮光应该是地下室朝阳的一面,就和L君进小门了。
L君有点害怕,我跟他说我带了手机,给他看在地下室我的小米2还有3G信号。我因为是学校门萨社(这个社已经没了)的社长,去年暑假的时候来过学校,有门卫处Z伯的电话,而且二姑父是W队的战友,实在被困住了还能打电话叫人。大不了领两张过失单(我们学校带手机被发现是一张,抽烟三张,积累三张过失单回家反省一天,五张得一进档案的处分),要高考了也不能把咱们怎么样。
L君跟我进去了,我当时也不知道门里面是什么情况,光在前头,但就是没有方向感了,想退后也没得办法,反正这里不是我们掉球的地方,我们转向了,跟地下停车场一样空旷,我当时也不是恐惧了,感觉热血上涌,跟L君说朝光跑,我们不知道怎么跑过去的,尽头是楼梯,记得我们看到亮光就连滚带爬地往上走。
我们从学校后门对着的那所小学的楼道里出来了,到室外的那一刻,我和L君顾不上什么了,大口喘气。旁边是一群小学生在出校门,现在应该是中午放学的时间,我们就顺着学生和家长的人流出门了,连午饭都没顾得上买,直接从后门回学校了。
那天的示意图,我的高中应该是全天津唯一一所不是正北正南向的学校建筑,哪怕海河教育园的新建的校区也没这么斜。
进班看见小温,他说看我和L君不出来,就直接把我的拍子带回班了,我问他潘博文的球拍呢(李宁的也挺贵)?他一脸疑惑地说潘博文是谁,我说就是跟咱们打球的10班那个啊,然后争执了一会儿,他一口咬定自己不认识潘博文,拍是我弄没的。
午自习之后,我去10班找潘博文,结果迎面碰上L君,他脸通红一脸激动地跟我说了一堆,特别大声就和嗷嗷叫一样,搞得楼道里的人都看着我们。我说到底怎么了,他冲我吼潘博文消失了,我心咯噔一下,说他不会在里面摔着了吧,L君当时眼泪都出来了,说他们都不认潘博文了,说L君神经病。然后年级组长X老师正好路过,以为我们俩吵架了,过来和事儿。10班里不断出来人说L君受刺激了可能中暑了,我问路过的一女生潘博文在哪儿,她跟我说L君中午回来一直说一个叫潘博文的人,可10班根本没有这个人,不知道搞什么鬼。
我听完赶紧下楼,去宿舍楼那里,结果宿舍楼的门和往常一样,加了把锁。我当时就软在那里了,头嗡地一下。下午第一节是化学,老师讲的我也忘了,只记得一句话都没听进去,第一节课下课去找了金老师,结果在10班那一栏根本没有他的名字,问他潘博文是谁也一脸懵。
我不想描述那个下午我是怎么度过的,只是小温坚持一下午没理我。晚自习时听班主任——一个中年男性语文老师说,10班有个人高考压力过大,说胡话被家长接走了,顺便讲了个冷笑话,说是让我们减压,说了没两句就又开始边讲题边扯了起来,一直扯到十天前湖人对勇士的比赛。
晚上回家的路上,本来想看手机登QQ,却发现手机莫名没电了,按照常理来说,任何手机的续航都没那么差回到家破天荒地开了一次电脑,结果发现L君被踢出年级群的信息,他貌似发了一百多条关于潘博文的信息,也回了我99+。我颤抖着搜了潘博文,没有这个好友,当时我几乎要晕了。我姐看到我开电脑,说她要用CAD,我就拿着小米充电去了。
开机,时间显示的是1970年1月1日11:52,我现在还记得那个画面,不过连上wifi之后时间正常了,QQ超时重登,无记录。相册大部分内容都损坏了,除了贴吧保存的图片。我不知道我怎么度过的那个时刻,之后这部小米2就一直无法使用相机闹钟和指南针。报修之后门店说陀螺仪损坏,镜头没事儿,相机我高考后刷了个MIUI V5之后倒是能用了。
这些聊天是最近的
以前的同学们依然对潘博文毫无印象
潘博文这个人,就像没有存在过一样,除了我和L君之外,所有人都认为他不存在。我还记得他的学号,但再看到花名册的时候,他们班整个学号都前移了一位。
我在晚饭的时候把这事儿说了,结果得来的是一句“你没发烧吧”,后来周末被亲姐(天医的硕士)拉去医科大医院心理科看医生,我还能清楚地记得那天是一位姓杨的大夫接待的我,最后他让家里别放在心上,我就是高考压力大。
我之后的反应倒是平淡极了,只是不敢往十班门口凑,10班班主任也找过我,告诉我L君情绪不稳定,不要贸然跟他接近,L君闹腾到二模也消停了。
高考,以为自己能上天南大的我,理综雪崩,物理没及格。凭着120+的语文和140+的数学(天津卷比全国一简单)去了西南的一所211.小温去了北京学土木,L君从211的水平掉落到天津理工,大二的时候就失联了,只是偶尔在朋友圈发代购,听周围人说他被送去土澳深造了,老师们都当他高考之前心态爆炸的反例,自从此之后,每届高考之前开放松解压的年级会。潘博文如果还“存在”着,应该是C9的水平吧。
我记得潘博文的小学——新港四小,初中——塘沽二中。他的生日——1996年8月18日,甚至他家的住处,新港街道的某个老社区,他约好高考之后跟我玩的游戏《伊苏四:塞尔塞塔的树海》,他喜欢徐良的歌,是泰达队的球迷,但我就是证明不了他存在。
后来,我发现了更多细思恐极的地方:
1.我记得小米推出过搭载WP8的手机,但事实并不如此。
2.我记得13年2月份《星游记2》开播,被誉为国产动画的高峰。因为要高考了没有追,但现在只有一个17年的《风暴法米拉》。
3.我记得天津大学和南开大学上小学时就在津南有校区,结果一查是近几年搬迁的。
4.我记得天津地铁9号线中间的几站是“塘沽——车站北路——远洋城——中心庄——钢管公司“而不是”塘沽——胡家园——中西村——钢管公司”
5.我记得我看过一部科幻/恐怖类型的电影叫什么闪电,好评度十分高,主角叫陈帆,他妻子叫戴琳。是王传君和邓家佳参演的,除了看的出戏之外故事十分棒,结果在豆瓣查并没有这部影片。
经其他网友提醒,这个电影应该是《球状闪电》,刘慈欣原著,网上显示还没拍出来
以下内容为2019.8.20更新:
我不是网络写手,就是一个码农,没必要在这里用我为数不多的双休长篇大论编一个故事来哗众取宠,更何况我已经两年没踏足天津,没必要写恐怖小说吓唬一群素不相识的人。
我也一度怀疑过自己得了癔症或者偏执等精神疾病,上大学和工作的这几年也约了不少心理医生,得出的结论都是心理压力大,我有段时间真的希望被诊断出什么来,但事与愿违。
我和潘博文的关系真的特别好,初中班主任姓刘教数学,我们俩都是英语徐老师的课代表,特别感激徐老师出色的教学能力对我英语水平的提升。初三的时候每晚都是我先送潘博文去浙小公交站等107,然后再回家。潘博文家住北仑里,中考后的暑假我去过他家,虽然不记得门牌号,但是依稀记得有一块新港路大队的路牌和十分高的电线杆,他家记得是一室一厅的,细节忘记了。
他父亲应该在国企,母亲在中原百货卖化妆品,因为送了我姐一套dior的彩妆,所以记得特别清楚。潘博文比较喜欢玩游戏,从胡侦探传说到老滚5我们玩了个遍,初二的时候我还送过他一张米米卡,当年赛尔号有个叫哈姆雷特的精灵,就是他拿我的号过的。
印象中潘博文的家附近
高中时他比较低调,依稀还记得他没进学生会,足球赛貌似参加过,不过具体的信息也握不住了。高一的时候有一回潘博文政治课写数学让老师发现了,还被拎出去数落了一顿,他跟我吐槽,所以现在还记得深。
他物理也不错,经常学老师用方言说话,掌心磁四指电拇指力,借了我一本《更高更妙的物理》,物竞用书落款还有他的名字,如果我能回天津,翻箱倒柜也要把这书找出来。印象最深的是11年清明节那天,我和潘博文一起去泰达足球场看了场泰达对墨尔本胜利队最后1-1平。
那天和L君出来之后也发生了不少诡异的事情,我记得当时三轮复习,数学有选修4-2讲矩阵和选修4-6讲数论,4-6的拉格朗日插值法我怎么也弄不清,数学老师还跟我说人傻一辈子事,你用不要的二项式除多项式就行。结果高考发现没有数论选择和矩阵大题还以为今年分布列换矩阵套路变了,结果我通过各种渠道得出一个结论,13年只有江苏和上海学4-2,4-6是全国任何一个地方都不学的!!!也就是说不可能是我记错了,因为我后来编程也用插值法,同事都是照着GitHub自学的,可是我又是从哪里学的???
潘博文身材偏瘦,戴眼镜,皮肤比较白。在我的记忆里沉淀了那么多年,连对他的印象都模糊了。你们可以说我是编的,可是我虚构这个人意义何在呢?如果我的文笔好到能去起点写文,我直接瞎编一个华夏国汉东省,起个龙傲天的名字直接在天涯贴吧开连载不就行了?
如果我在这里无中生友,必须得先架构一个不能矛盾的世界观体系,然后为了不露馅继续添加细节,我要是编的何苦把具体的地理信息数学知识点甚至直男不太懂的化妆品名都介绍一遍?潘博文是我朋友,我写出来什么都会让我感觉我在消费他,有的时候不知道是恐惧还是无奈了。
高考到现在,我不止一次陷入了对自己的深深怀疑,写出来就当树洞了。
以下内容为2019.8.23更新:
我明天去医院,之前几次就医都没有把这个事情原原本本地说出来,这次打算给医生看这篇文章。
联系L君了,明天医院看结果,谢谢各位,决定好好工作了。
以下内容为2019.8.24更新:
今天是8月24日,去了医院,医生根本不在乎这篇文章,建议如果这个事情不影响我生活,就不要去追究了。L君我觉得他不想再触及这件事情。答主周日上班,抱歉不能回复。有提出让我去潘博文家看看的,其实我高考之后路过那里很多回,只是不知道具体的位置罢了。至于初中毕业照我当然翻过,潘博文消失的当天晚上就翻了,合照里找不到他,高中毕业照是5月末照的。当年流行填写同学录,他那页应该在很靠前的位置,但是始终没有那一页。时间冲淡了别的情绪,我也无法还原当时的一举一动。
以下内容为2019.9.22更新:
今天是周末,川沙外面天雾蒙蒙的,下着雨,风也很大。不由得想起我的朋友潘博文,我不知道他身在何处,或者评论区让我怀疑他是我为了排忧解闷臆想出来的人,我不想过度纠结。
我还能回忆起的就是潘博文老家在河北唐山迁西,因为他跟我说过家乡的水下长城和喜峰口这两个比较著名的景点,之前追过名叫《明末边军一小兵》的网文,对喜峰口、冷口、界岭口等蓟镇要塞印象很深。
平时开玩笑的时候,他就和赵丽蓉春晚还有相声《宇宙牌香烟》的推销员一个调。但是因为天津有几个地方也是说唐山话的,所以还不敢确定。
浙小公交站
我初中日常送潘博文回家的地方
至于潘博文的家,我绞尽脑汁也想不起太多细节,并不是我刻意隐瞒,这段记忆不知为何一直都很模糊,好像被什么擦去了一样。如果我真的编故事,肯定要对他家大书特书。一室一厅的华北普通老式小区,当年盖的楼基本都一个样子,仿照苏联形式。我和他放学不顺路,我住火车站附近,他在港口附近,不过因为我家离学校近所以为了聊游戏能每天送他去车站。
评论区找出了不少信息,小学初中高中大学的校友都出来了,不过我不能说得太详细,和公司里同事知乎互关的有很多,已经有人开玩笑问这篇文章是不是我发的,如果领导和HR看到了,对我日后的工作可能有影响。
最后附一张最近和高中同学的聊天记录。
后续发酵
以下网友热议
关于后来解释澄清的版本,还有L君不是同学是熟人,小温是圈里的其他人,这个解释似乎彻底指向了编故事,而不是精神疾病的范畴了,不知道是真是假。
说一说✏️
笔者我的看法 [灵光一闪]
这篇网文能够引起轰动,第一就是感同身受的真实性,其次,网友们心中曾有属于自己的秘密和难以理解的过去,有的网友希望现实里有戏剧性的事件发生。这没有什么不好的,在这棱角分明的现实世界中,人们依然需要有自己想象的空间。这个13亿多人口的中国,不可能没有一些离奇古怪的事情来润色,不是每个人心中的故事和秘密都能写的详细和清晰,迷信和幻想总能揭示人们心灵最需要探知的奥妙。
如果有一天在我们的身上也发生了解释不清楚的事情,那么别人会不会当成故事一样听呢?
这个事你怎么看?写出你的看法感受,对比你作何评价?
运维日志
长久以来运维的真实事件,日志管理都是IT运维工程师不可回避的工作,它不但可以跟踪IT基础设施活动,更是回答故障是否发生、如何发生、何时发生、在何处发生的最佳答案。
如果把运维看做是医生给病人看病,则日志就是病人对自己的陈述,很多时候医生需要通过对病人的描述中得出病人状况,是否严重,需要什么计量的药,什么类型的药。所以古人有句话叫对症下药,这个症就是病人的描述加医生的判断,在重一点的病在加上很多的化验。在医生看病时病人的描述和化验单上的数据对医生是非常重要的。同理日志在运维中的作用也是类似的,但非常不幸,日志在很多运维中被严重低估,直到磁盘空间不足的时候才想到,这有个大的日志文件把运维的真实事件他删运维的真实事件了,这样可以节省空间。
下面运维的真实事件我们来看一下常用的监控系统,界面做的很漂亮,功能也很多,但是有个疑问就是你会天天盯着这个界面看吗?我感觉绝大多数人不会,很多人关注的是异常点,就是当系统有问题的时候,你告诉我哪里有问题,然后我在根据问题去分析,去处理,当然做处理的时候,这个系统就会用上了。
那上面这些内容和日志有什么关系呢?
日志本身是没有价值的,只有对日志进行分析加以利用的.时候才会有价值,日志中包含非常多的有用的信息,不光包括运维层面,还包括业务层面,安全层面。很多时候运维需要的是一个统一告警平台,但告警的依据绝大多少是对日志等进行自动化的分析得出的结论,所以说日志是很重要的。
什么是日志
简单地说,日志就是计算机系统、设备、软件等在某种情况下记录的信息。具体的内容取决于日志的来源。例如,Unix操作系统会记录用户登录和注销的消息,防火墙将记录ACL通过和拒绝的消息,磁盘存储系统在故障发生或者在某些系统认为将会发生故障的情况下生成日志信息。日志中有大量信息,这些信息告诉你为什么需要生成日志,系统已经发生了什么。例如,Web服务器一般会在有人访问Web页面请求资源(图片、文件等等)的时候记录日志。如果用户访问的页面需要通过认证,日志消息将会包含用户名。这就是日志数据的一个例子:可以使用用户名来判断谁访问过一个资源。通过日志,IT管理人员可以了解系统的运行状况,安全状况,甚至是运营的状况。
日志能做什么
在一个完整的信息系统里面,日志系统是一个非常重要的功能组成部分。它可以记录下系统所产生的所有行为,并按照某种规范表达出来。我们可以使用日志系统所记录的信息为系统进行排错,优化系统的性能,或者根据这些信息调整系统的行为。在安全领域,日志可以反应出很多的安全攻击行为,比如登录错误,异常访问等。日志还能告诉你很多关于网络中所发生事件的信息,包括性能信息、故障检测和入侵检测。日志会成为在事故发生后查明“发生了什么”的一个很好的“取证”信息来源。日志可以为审计进行审计跟踪。
从一条日志说起
111.88.155.166 - - [17/Dec/2015:13:06:05 +0800] "POST /login HTTP/1.1" 302 0 "http://secilog.abc.com/login?langType=zh" "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36"
这是一条很普通的nginx中记录的日志,日志的详细内容可查阅相关文档。这里简单说明一下主要的内容。从日志中可以得到访问者的IP,访问的时间,时区,请求的方式,请求页面,返回状态,来源等等信息。仔细一看请求的页面/login就可以猜到只是一个登录请求页面。这条日志的重要含义是登录成功。
从这条日志怎么和我们关注的指标对应的,我们下面接着分析。
活跃用户数,活跃用户说一般是指同一天有多少老用户登录过系统。这个时候就会发现,刚才的登录日志中如果放到一天的统计中就可以知道,一天内有多少次成功等登录的次数了,但细心的用户可以发现,不准确,因为用户可以重复登陆,这就会造成重复,说的很对,那我们在细化一下,我们换个角度分析,一天内登录成功的不重复ip的数量。是不是更接近真实的结果呢,我感觉从量级和趋势上已经能说明问题了。
刷单用户这个没有标准的说法,我的理解是是同一个人为了某种目的大量注册了很多账号后,然后进行某种操作比如刷单等。这种行为很难100%杜绝,但从这条日志中可以得出一些有意思的发现。如果同一个ip一天登录成功次数过多,比如一天登录了一百次,每次间隔的时间都差不多,说明这个人有刷单嫌疑,可以先找出来然后再进一步的分析。
新增用户数的含义是一天内有多少注册成功的用户,这个时候可以类比登录日志,只要把登录日志的url换成注册日志的url就可以发现一天新增的用户数是多少。
同理恶意注册用户数也是类似的,一天同一个ip下注册成功的次数非常多。此ip恶意注册的可能性就很大。当然还需要进一步的分析,比如ip是否是一个大楼里面的出口ip,注册后此用户做了什么来判断。
从上面的分析可以看出举一反三,可从日志中可以看出运营中的很多内容,比如浏览商品的排行,用户访问时间,用户来源等等。
下面我们还从这条日志中分析一下安全的行为:
111.88.155.166 - - [17/Dec/2015:13:06:05 +0800] "POST /login HTTP/1.1" 200 0 "http://secilog.abc.com/login?langType=zh" "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36"
这还是一条登录日志,唯一和上面登录日志不一样的地方是服务器返回值。一个是302,一个是200.有什么区别的,302的意思是服务器进行过页面跳转,200还是返回此页面,从中就可以理解,这是一条登录失败的记录。很好,有这条记录就可以发现很多的安全行为。
恶意密码猜测,可以理解同一段时间,用户大量的登录失败,返回了很多登录失败记录。从这条定义中就可以发现规律,我们把时间放大到5分钟,当5分钟内,同一个ip有超过20次以上的登录失败行为,基本上可以断定在进行密码猜测。当密码猜测有自动的也有手动的,如果区分呢。我们看一下这个内容"http://secilog.abc.com/login?langType=zh",这个含义是post提交的来源是"http://secilog.abc.com/login?langType=zh"这个网页,也就是从这个网页发起的。如果这个地址不对,极有可能是用工具来进行暴力破解。
同理cc攻击就更容易理解了,同一个ip在很短的时间内访问了大量的请求,基本上可以认为是cc攻击。其他的webshell,sql注入等也可以从日志中分析出部分来,但不是太准确,因为日志中指记录get请求的参数,post参数正常是不记录的。
从上面的分析中可以得知,日志中还是有很多宝贵的东西在里面,只是我们没有发现。
; 关于运维的真实事件和运维的真实事件叫什么的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。 运维的真实事件的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于运维的真实事件叫什么、运维的真实事件的信息别忘了在本站进行查找喔。发表评论
暂时没有评论,来抢沙发吧~