@gaoxiaoyunwei2017
2017-12-18T15:35:47.000000Z
字数 3093
阅读 566
wt
在联想工作一两年的时候,我认为DBA作为一辈子的职业挺好的。虽然当时刚进去薪资不多;但是后来因为我表现优秀,同时我们DBA岗位非常重要,工资提得很快。到2007年的时候我发现一个问题,Oracle好像跟互联网没有什么关系。由于太贵了,整个互联网基本没有谁在用Oracle;大家都用免费、开源的MySQL。
当时听说一些游戏很火;例如《天龙八部》同时支持上百万人同时在线。虽然Oracle厉害;也不可能一台Oracle支持百万同时在线的用户。在这么复杂的场景下,他们是怎么解决这个问题。出于想去看看的目的和Oracle DBA以后的职业发展会出现瓶颈的两个方面原因;决定投身互联网浪潮中,当一个弄潮儿。在2008年的时候选择了搜狐畅游;当时去搜狐畅游有两个原因。
其一,因为当时搜狐畅游用了很多MySQL,在畅游有更加复杂的场景。
其二,当时搜狐畅游HR很含蓄的给我说,公司很快要上市了。当时是2008年给我说的,果然2009年的时候就上市了。
刚去搜狐畅游,我们组里已经有两个DBA;一个男的,另一个是女的。当时我们三个DBA是平行关系的。一年之后,我被 提拔为DB组主管;但是这两个同学从内到外全方位的都不服我。首先,男的当时已经是全国很有名的MySQL DBA,负责很多业务的数据库;而我是做Oracle的,MySQL还不懂。那个女的DBA是完全不服。当时得知我被提升为DBA主管后,她二话不说冲进办公室质问经理说,为什么是他不是我。
当时刚开始的时候压力非常大,通过一些方法最终还是把和他们的关系理顺了。对于男的让他和实习生去交流,再逐步把他很多技术的东西变成标准文档。还有就是他要做什么就做什么,搞不定我来帮搞。例如,他要服务器资源申请不到;我去申请给他。最后,我们的关系还不错;在那边走的时候,那个女的跟我说你很仗义。
当时在搜狐畅游,程序部、测试部、运维部三个部门是分开的;我们运维就是个背黑锅的组织。那时程序部与运维部是天敌。由于CTO是程序部出身的;这种天敌关系非常严重。常常会说那帮傻逼,这都不会。
当时也是挺龌龊得,《欧洲天盟》服务器关了四五个小时都没有人知道,当时也没什么业务量。结果其负责人说他们不管我的业务,我的业务不行就是运维出问题了。当时做了一件事情,就是做了零故障委员会;这件事情也导致我最后离开了搜狐畅游。
零故障委员会记录每个故障;根据它的影响人数、时长进行打分。例如,上个月所有故障评分是200,这个月是150,下个月是100;我们逐渐的让它无限趋近零。
当我们将故障事故全部统计起来,发现程序部导致的故障占到了50%以上,测试部也有一些问题占10%,真正运维部导致的故障占30%。
但是不管怎么样程序部是创造者,做得好坏是一回事;运维只是一个维护者。显然创造者比维护者级别更高。
另外,一开始程序部来挑战我们的数据,说我们的数据肯定是瞎搞的;事实上并不是。这个事件更加加剧了程序部和运维部的矛盾;他们有点恼羞成怒了。后来运维部发生了一次大的故障了;结果程序部以此为由将我们运维部老大搞走了。
那个时候,作为我而言;我是觉得人是要有骨气的,当然肯定是待不下去了。
一直到2010年,我认为这辈子都做DBA主管也挺好的;但是在2010年底发现一些问题。如果说我在一个专业不能够做到顶级;那么对我来说是一种伤害。Oracle我做不过盖国强,MySQL做不过叶金荣。在DB这个行当里面自己已经摸爬滚打十来年了,当时想觉得纵深已经够了。看看能不能横向扩展。例如,去做运维总监、还有别的业务;还要管网络、管系统、管运营运维等等。
继搜狐畅游之后,2010年底去智明星通做运维总监。在智明星通对我来说是一个转折,有一个纵深的技术专家变为横向管运维的。在智明星通,能力方面拓展了一些。经过两年半的时间运维总监该管的都已经管了。由于它的业务在海外,在国内没有业务、没有机房;我想做运维做到这个样子基本上也就差不多了。
在2013年,我的一个老领导说他在一家公司做运维平台。我想这个不错,可以将自己的技能固化下来;对于自己来说是个机会。于是入职世纪互联。比较悲催的事情是我入职第二天被告知这个项目被取消了。在世界互联的日子还是做了很多事情;其中之一是我让世纪互联成为了微信在欧洲唯一的IDC服务器网络的提供商。在世纪互联体会到两点。
第一,转行需要有样的成本;
第二,你要能够转得很顺利。第二年就从世纪互联出来了。
当时在世纪互联的时候,云计算很火;刚好触控科技如日中天。去触控科技对我来说也算是一个平台。
在触控的时候业务非常多,前半年非常辛苦。当时运维部十几个人,没有分工;基本上是来个活,看谁闲着就给他去做、看谁能力强就给他去做。大家都很不爽,后来做了个运维经理制。将沟通能力强的人拉出来,由他们去做接口;他们和业务部门做接口后面才是干活的。这样做事情,当时COO非常开心。因为一方面一个事情我们交付速度会提高;另一方面如果一个事情完成不了,那你要提前预警。这样做起事情来,大家都很OK。
触控是我的第三次阐述;找一家快上市的公司,我拼命等着别人吃肉我喝汤。触控当时如日中天,很多牛人都汇聚过去了;当时触控也给了我一些期权。触控在2015年4月份已经确定在美国纳斯达克上市。然而CEO在上市前一天突然决定不上市。
当时我在想一个问题;如果说我在一个公司做的很好,有什么用?如果这个公司倒掉了,那么我所积累的所有资源实际上全都没有了。我们怎么可以对自己的未来更负责一些或者更进一步对社会有点贡献。我认为第一件应该做的事情就是建立自己在行业的影响力。
现在在做的高效运维社区对于我而言没有刻意为之,是顺水推舟、顺势而为的事情。我的第一个技术演讲是在2014年的全球互联网技术大会上,当时的议题是构建高效运维团队;主要是在触控前半年总结出来的东西。
后来一次演讲代表触控去AWS全球技术大会做中国厂商的演讲,此次议题是“和Cocos一起共享中国游戏盛宴”。该活动认识了当时infoQ的主编崔康。他和我说,你做演讲没用;应该去写文章。一次演讲顶多影响三四百人;但是写文章不一样,好的文章能影响上千人甚至上万人。后来在infoQ上就有了个专栏。
在2014年底的时候,正式开始创建高效运维公众号和微信群。当时发现单凭自己去写文章,写不了那么多。所以就让别人来写,现在证明这是个很好的路子。那个时候我们就开始把很多朋友汇聚过来,像老王、大梁、梁定安等。
当时的文章是咖啡党写的,文章的阅读人数不久前突破2万。在2015年底的时候我们举办了GOPS全球运维大会,开始把运维的声音发出来。目前来看这个目标确实实现了,很高兴。
2016年5月份出来创业实际上我内心还是蛮风起云涌的。
一方面是我的角色变了,没有铁饭碗了;
另一个方面有些同事进来,不管是房租、人力等很多关系都需要梳理、去处理。2016年我们的安排非常丰富;压力也非常大。
九月份在上海站我们搞了个DevOps Master的认证培训。十月份我们去美国办了一场全球运维大会。由于对当地的环境了解不充分;但是结果还不错,有一两百人的规模。
2017年在国内高举DevOps大旗,不管是DevOpsDays这样的活动,还是DevOps峰会;这都是我们做的一点事情。
现在要做的事情更加酷一些,就是我们这边正式在中国信息通信研究院底下一起制定DevOps标准。
将来在我们社区里除了不能得到女朋友以外,各种帮助都能给你;例如个人职业发展,帮助你如何去做情绪管理、人文关怀等等。最终,我们希望社区能够给你提供一揽子的服务。