[关闭]
@gaoxiaoyunwei2017 2018-01-23T15:09:59.000000Z 字数 2335 阅读 615

命脉保卫战-核心数据/业务的IDC重保思路

白凡


页头
讲师 | 肖玉军
编辑 | 白凡

今天要分享的是关于一个核心数据方面的内容。整个在运维的体系里面,我们看看IDC的运维是落在网络层的哪一个分支。

image.png-283.2kB

网络层其实很简单,希望这里清楚的能介绍基础网络运维的一些工作。相信大家对这个数字是非常的熟悉了,这是我在网上借用的,前不久一个重大活动,就是双十一活动的一个数据,这个数据对我们运维人来说可能大家不是很敏感,但是对我这个做产品的来说是非常兴奋得看到这个数据,接下来还有一个数据,这个数据是伴随着前面这个数据来衍生出来的数据,这个数据我们运维人就非常敏感了,这给我们带来了庞大的一个工作量,前面的数据是让大家都很兴奋的,后面这个大家都很焦虑。

image.png-97.1kB

那随着数据业务的增长,我们运维人员要面临一个很大的挑战,第一个是成本的一个控制,第二个是安全,第三个是质量,第四个是效率,那在成本这一块是我们资源在流量突发的时候,资源的一个采购成本,还有维护管理的一个成本,一个未知投入的成本,在安全这一块是网络安全,一个信息安全,还有我们的冗余灾备的安全,这个网络出口质量,我们也不希望我们用户体验感急速的下降,还有数据传输质量,这个在解决方案里面是要用到高速的传输,二层传输的一个品质,第四个就是效率的问题,我们运维管理的效率,能不能在流量突发的时候对新增的业务进行快速的部署,比如说昨天听到有讲师跟我们分享了半天上线这样的一个案例,其实这个是非常,我觉得是非常值得我们IDC行业去借鉴的一个案例。

image.png-129.6kB

那整个我们客户的一个数据量的上升给我们IDC带来了很多的挑战,我们是一个首先在业务的驱动方面,我们是需要更多的一个匹配,一个精细的调度,还有整网的视角,我们在资源的配备上面做了很多很多,比如说我们的一些冗余灾备,包括机柜量的冗余灾备。他不把数据放再一个单一的IDC,他更多的是在一些公有云上面,自建的私有云上面,还有分支站点,这个都是需要通过我们的VPN通道把这所有的他的一些数据进行一个互联,安全的一个通道。

image.png-140.1kB

那正是因为有了数据的突发,也就有了我们所谓的一个命脉,数据就是命脉,命脉的保卫战,那在流量突发的时候,不断带来的一个流量的高峰对我们网络的冲击,然后一个数据安全的一些问题,还有就是我们面对突发流量要去灵活申诉掌握带宽的成本,还有业绩突增,这都是我们愿意看到的一些东西。在我们IDC所有这些东西都是可以兼得的。我们是通过一些什么方式去做到这个高品质的一个IDC,就是有一个很高的保障,我们是通过了全国的一个T级的骨干传输和出口带宽,我们在全球的运营商累计已经达到700G,在全国传输总量达到350G,我们又部署了,在IDC机房都部署了高安全的防护系统,也是用华为的DDoS防御系统,其实现在没有有效的方法,就是生抗,我们去生抗就是我们有一个T级的骨干出口带宽,这个是足够去抗现在主流的一些攻击了,一般也就是100到200个G也就算是大的攻击了。

image.png-173.5kB

这是我们在全球布的一张环状网络,我们现在已经布到三个环,一环是核心城市的环,就是我们在资源最优势的北京、无锡和深圳,在上海我们是明年的上半年会有一个规划,然后这是我们的二环,二环是针对中国互联网就是运营商的8大核心节点去布的,然后就是海外的一个专环,我们叫三环。

image.png-144.7kB

正是因为有了之前所有基础工作,才会有了我们有区别于行业标准的一个尚航的标准,我们从今年5月份到现在我们的IDC都是达到了99.99%的标准,这是我们为客户做的一些战略的一些解决方案,这是一个同城双活的解决方案这是两地三中心,也是通过我们全国各地的高品质的一些大容量出口的一些IDC机房,然后加上我们的一个全光环网络给客户提供两地三中心的解决方案。

image.png-154.9kB

这是我们用的一个现在主流的SDN的技术,也就是我刚刚提到杨一兵总现在赶制一个预计在12月30号之前落地的网络,我们的IDC机房之前都是通过SDN的技术,让所有的IDC机房客户放在我们IDC机房里面,都是在内网里面,用这个技术去实现的,在客户的分支站点,他的一些办公的私有云,公有云,包括海外的一些节点,我们都是通过我们的一个SD1的网络并到整个IDC的内网里面。这是我们VPN事业部提供出来的产品,是为客户内网和外网的解决方案,数据中心企业的总部,移动办公人员+一些企业分支站点之间的一个MPSVPN的解决方案。

image.png-244.6kB

这是尚航特意针对一些重大活动,也就是说在这次双十一的时候,我们有时间的重保方案,首先在重大活动的时候会安排人员一比一冗余的配备,还有流程,我们制定了紧急事件应对流程,和模拟的演练,使我们在出口带宽IP所有的资源池做一个保障,在重大活动期间我们是禁止一切的施工,就是机房内的一切施工去打造这样一个重点保护。这个也是我们杨一兵总现在也在做的,就是我们自己有研发了一套自动化的运维管理平台,这个管理平台是通过我们原来的工单系统的优化,再加上机房内所有的服务模块都会导入到那个平台里面,进行一些智能化数据的分析。一些采样进行一些分析去提高这个服务的效率。

image.png-181.3kB

image.png-142.3kB

image.png-157.9kB

image.png-98.7kB

image.png-189.5kB

image.png-214.2kB

我们在运维响应机制里面也做了优化,就是会有一个一线二线三线这样的一个T队的服务响应机制。

image.png-391.8kB

这是我们的天眼监控平台,这个是实时的监控我们所有机房包括客户,包括我们的网络设备的一些所有的一些场景,包括他的一些附带情况会实时的发布到自动化运维监控里面去,结合我们运维的经验进行一些精准的分析,我们现在是可以做到秒级的反应。

image.png-452.1kB

这也是我们众多支持我们的一些小伙伴,主要是覆盖了一些游戏行业和互联网行业的一些客户。也希望大家通过我们的微信公众号去获取更多我们后台技术的一些交流。

image.png-324.2kB

今天因为这个也是很突然的,就是本来是有更多的一些技术的干货给大家去分享,待会儿我们的市场人员会有在群里有红包给大家去表示对不起。谢谢大家!

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注