[关闭]
@chris-ren 2016-07-07T09:05:33.000000Z 字数 7143 阅读 1340

首都在线郑义:十年定能磨一剑,专注把IaaS服务做到极致

IaaS 云计算


2011年首都在线发布第一代“云主机”。目前,公司已由IDC服务商发展为云计算服务提供商,专注于向企业级客户提供IaaS服务。去年他们在自己的云平台发布会上提出云连接世界的口号,为客户提供全球私有化网络。

近日,InfoQ中文站编辑采访了首都在线CPO郑义,请他分享了首都在线云计算服务的发展历程、遇到的挑战以及他们的发展方向。

InfoQ:先介绍一下你自己,谈谈你的个人经历以及目前的主要工作

郑义:高中毕业后我开始出国学习,在英国完成了大学本科的学习,专业是计算机网络。毕业后,正好有一个机会进入Janet做网络相关的工作,Janet是英国最大的面向科学研究和教育机构设立的专用网络,有点像中国教育网。在这个公司我做过几个职位,最后做到网络部经理,主要负责整个英国教育网的规划和实施工作。

大概在07、08年的时候,我离开了Janet,进入MaxNett公司。这家公司主要是做IT服务,当时赶上英国的金融危机,对于IT服务公司来说,必须要提供一个解决方案帮助客户掘钱。在那个年代,MaxNett开始做云计算相关的工作,也是因此我开始接触云计算,直到2011年。

离开MaxNett,我来到了首都在线,首都在线是我在中国的第一份工作。在首都在线负责的工作相对比较多,刚开始我主要负责云计算平台,后来开始带售前团队、解决方案团队,再后来做了两年的运维总监,期间做了海外的业务。从今年开始,我又回到技术岗位做产品,我现在担任CPO,主要负责首都在线所有产品相关的工作,除了平台产品的落地、新产品的开发,更主要是去规划更长远的,比如两年以后、三年以后首都在线应该干什么,这就是我现在的主要工作。

InfoQ:也就是说你现在从事的工作内容比网络更广泛,不仅仅是涉及到网络这部分内容?

郑义:是的。我是网络出身,在MaxNett的时候,就已经有这种说法,网络和系统是一起做的,尤其是网络是为系统服务的。虽然网络是非常核心的部分,但是让一个网络有价值的,最终还是它上面的应用。这些应用中,近几年我做得最多就是云计算,在首都在线,我还需要把首都在线这个产品从云计算提炼出更多,把真正能被用户所接受的解决方案和用户可接受的顺应时代的技术结合起来,让整个云计算平台能够跟着技术的发展去进步。

InfoQ:你的介绍里边有提到过BT的公司,这个是机械吗?

郑义:不是,BT是英国电信,我在那做过工程师,这份工作时间不是很长,当时我们有个大的项目是21CN,对于BT来说是21世纪网络,当时我主要参与建设他们现在用的所谓的宽带存在网,那会我只是个工程师。

InfoQ:接下来我们聊聊首都在线,对于首都在线这个名字,我们都觉得挺有意思的,但是没有太多资料介绍这后面有什么故事,想请你结合自己在这个公司的一叶见闻,介绍一下首都在线发展的背景和一些主要的成就?

郑义:很多人都知道,首都在线是一家很老的公司,现在的公司叫首都是很困难的,所以从名字也可以感受到这到家公司是很有历史的。

首都在线是1997年开张营业的,当时做得第一个业务是提供拨号上网,为什么取名叫首都在线?当时,我们好像是全国除电信、网通以外第三方提供拨号上网的第一家公司。那时我们主要做拨号上网,在中国互联网初期时代,大家对于网络的认识也都比较浅,那会拨个电话号码就可以上网,当时电信是169,网通是163,我们的拨入号是263,所以首都在线这个名字就是从那个时候来的。

当然从这个也能看出,在今天的市场上,从网络和数据服务来说,我们应该是云计算里面历史最悠久、经验最丰富的一家公司。大家在一些宣传或者我们对外的口径中了解到,我们拥有十多年专业经验,其实我们是一家拥有20年数据和网络经营经验的专业做服务的公司。

在当时,有了网络,但是网络上没有应用,所以首都在线自己做了一些应用。263集团大家应该听过,当时我们在263网络域名下面,提供各种网站服务,提供一些很基础的DNS服务,甚至是什么网络时间服务等,这些可能现代很多人都不清楚了,但是在那会我们就在做很底层的互联网技术服务。这里边有一个比较出名的就是263邮箱,当时大家都在提供邮箱,我们也在提供,后来263集团成为中国最专业的收费企业邮箱,就跟首都在线的业务分离了。这就是首都在线一个简短的历史。

InfoQ:这么长时间,首都在线一定积累了特别多的硬件资源,作为一家云平台服务的公司,除了硬件之外肯定还需要软件相关的东西,想请你谈一下首都在线软件的架构是怎么样的?基于自主研发、开源软件或者用其他第三方的商业软件?理由是什么?

郑义:我们的确积累了很多网络方面的经验,在2010年选择云计算的时候,对我们来说绝对是个很新的技术。在当时,云计算里面有个核心词——虚拟化,那时可选的虚拟化平台并不多,像Hyper-V、VMware等,因为我们是IDC转型,我们非常清楚地知道我们的客户需要什么。

我们云计算的设计初衷,就是怎么样快速提供服务,怎么样稳定的为客户提供服务。我们提出了快速安全稳定这几个必须的要素。当时我们在设计的时候,我们面向的两个客户,一个是游戏,一个是当时比较大的企业,他们对整个IT平台的要求,是我们设计云平台的一个基础。所以我们选择的方案跟今天市场上很多都不一样,在虚拟化这一层,我们选择的是商用的解决方案。这种商用的解决方案,首先它肯定不是为公有云设计的。我们在过去的一年投入了非常多的人力物力去研发这样一个自己的云计算平台,虚拟化软件只是中间很小的一部分,最根本的是,我们怎么让首都在线这套平台更好的去管理这些硬件的服务器以及网络,这一部分,我们完是全自主研发的。

现在市场上很多家都在使用OpenStack这类很出名的平台,我们经常开玩笑,我们是从头到尾写了一个我们自己的OpenStack。这个当然会花很多的精力,我们也投入了很多的人力,也会带来很多问题,因为确实自己写一个也是很困难的,但是它带来的好处是,更适合我们的目标客户。实际上在我们这几年的努力当中,我们在电商、游戏这些行业取得的成果是有目共睹的,基本上中国主要的电商都是我们的客户,中国主要的游戏公司也都是我们的客户,这是对我们这几年在整个软件方面以及在我们整体架构上面做出选择的一个很好的回答。

InfoQ:从市场上的声音,或者是公网上来看首都在线目前的主要产品可能还是云主机,我们想知道为什么首都在线不像其他的供应商一样,涉足其他领域?

郑义:我们内部的愿景以及我们内部专注于做的,就是把云主机做好,把IaaS服务做好。我们最开始是做网络的,到后来我们做数据中心。我们一直都在IaaS这一领域,我们坚信,首先IaaS未来的市场是会非常大的。第二,我们不认为任何一家公司能把所有的东西都做好。我们认为我们专注于做好IaaS,这已经是个非常好的结果。

大家看到的实际情况是,我们现在只有云主机,我们的云主机是很好的。在PaaS方面,可以看到我们的网站上已经有很多PaaS了,像云安全、我们网上接着会推出的DNS服务,我们在八九月份要推出的备份服务等。

但是,我们的实现方法和很多厂商不一样,PaaS服务方面,现在我们走的路线是跟所有的合作伙伴合作。两年前,我们投资了一个公司叫首云,我们的PaaS是他们负责去做的,这家公司的员工都来源于像IBM惠普这种大企业,他们知道真正的企业需要的PaaS是什么样的,而且这家公司帮我们提供SaaS服务的,像我前面提到的云安全、云备份都是他们的产品。同样的模式,我们也在跟其他企业在合作。

我们希望搭建的架构,有个非常稳定且庞大的IaaS的平台,上面有所有的PaaS服务,我们希望每个企业专注的东西可以放在我们平台上提供更好的服务。所以说什么都能做,并不是我们的理念。我们在过去几年一直都在专注做IaaS,我们是一个完全Open的平台,让更多的专注做PaaS的企业能够跟我们一起合作,共同打造一个完整的云计算服务体系。

InfoQ:就是说很多专业的公司,垂直领域的公司共同组成一个专业的在线服务?

郑义:也可以这么说,像最近的直播云,我们也是在跟专业的公司去谈。

InfoQ:去年首都在线在自己的云平台发布会上提出了云连接世界的口号,我们知道首都在线的云主机服务是通过自己的全球私有化网络实现全球主机联网,这背后对网络的要求可能会非常高,所以想请你谈谈背后的这些挑战是怎么解决的?有什么样的解决方案?

郑义:我们去年做这个,是因为我们在过去几年云计算整个经营过程中,我们看到了这样的趋势,所有的客户在满足中国市场需求的情况下,他们也在寻求发展,也不得不用一些国外的服务,这时如何保证数据和网络之间连接的稳定性,这是客户的一个需求。

这里面的挑战是非常大的,如何解决各国之间带宽拥挤的问题,如何真正用好这些资源。因为我们的专线或者我们自己的网络,从去年发布到现在都是免费的,这个成本是很高的,这些都是很大的困难。

如何解决这些困难?首先,技术方面,我们有很长远的技术积累,我们从一家拨号上网公司到现在的网络,应该说所有云公司里面我们是最强的。第二,资源方面,云计算是网络上的一个服务,我们之所以从网络这个角度去深入到云计算,我们也希望,再一次让客户能够重视,为什么我会用到重视这个词?很多用户会被一些新的功能所吸引,很多时候忽略了背后网络的意义,云计算跟其他东西不一样,完全是一个在网络上生成的应用,没有一个很好的网络,不可能变成一个完整的IT架构的。关于具体的解决方案,首先,在这个里边,我们自己有一个SDN的东西在运行,我们也在上面做了很多的开发,让整体的全球的传输网络,实现全自动化配置,全自动化扩展以及对所有用户的流量分别进行保障,进行优先的选择,这句话有点绕,因为在很多网络里面有各式各样的通讯,有的通讯是需要保障通讯,有的通讯可能只要保证它不断就可以,那在网络上面必须要对这些东西进行分类,这里我们积累的SDN等技术也起了很大的作用。

InfoQ:可以说主要用的软件定义网络这套方案?618刚过去,有所了解。你刚才也说了,国内主要的电商平台都是首都在线的客户,我们知道对于电商平台高并发是个非常重要的需求,也是个挑战,而且大部分电商平台都会在一个时间段,做一些大规模的促销活动,这块对基础设施服务商的稳定性和扩展性要求会更高,所以想请你谈谈首都在线是怎么应对这种情况的?在性能和资源之间是怎么找到这个平衡点的?

郑义:是这样的,这一点说复杂也不复杂。最主要的,应对这件事要有规模,事实上我们能够应对618的各种事件,或者说能够应对比如双十一,或者比如我们之前的一个客户,当苹果要发布一个新的iOS系统时,需要做大量的测试。

我们之所以能够应对这些情况,首先在整个技术平台上,我们有大规模的服务器、储备。当然你不可能就买一堆服务器,在这里,如何让这些负载能够更好地、更均匀地分布在各式各样的刀片上面,这才是我们对硬件管理的核心技术。云计算特别是IaaS,唯一要做的,就是管理好这些资源。我们自己写的叫JIC的程序类似OpenStack的平台,无时无刻都在监控着所有这些刀片的负载,哪些人的负载高,哪些人的负载低,哪些人的波峰出现在昨天晚上的几点等等,我们平台会有完整的记录。比如618,它会发生在12点,我们会把一些没有发生在12点波峰的这些客户的应用转移到相应安全的一些机器上去,因为有的人的波峰可能出现在晚上两点,有的人的波峰,比如一些国外客户的波峰可能出现在早上四五点,因为于我们有长期的数据的记录,我们可以分析出来,怎么样让放在我们服务器上的电商的机器能够平稳的渡过它最高峰的一个交易浪,最主要的还是你对硬件的管理,对资源的管理。大家都知道,只要服务器多,来多少促销都可以。但是对一个企业来说,企业是要盈利的,所以最核心的技术就是去管理它,有效地去分配它,而我们的确在云计算上获得的所有的收益都来源于对这些硬件有效的管理。

InfoQ:还是在资源的灵活调配上面下工夫?

郑义:这是必须的,云计算是把一堆人的东西拿过来放在这个资源去共享,我们怎么样管理它是非常最重要。

InfoQ:在电商平台公有云的安全性也是大家都关心的一个问题,想问一下首都在线是如何从技术和服务两个层面去保证数据安全的?

郑义:数据安全要分几个方面来说。一方面我们经常说的数据安全是指这些数据存在这里不会丢失。其实我们在选择平台的时候,安全性以及稳定性,这是最开始要考虑的。因为我们选用了商用方案,没有用到任何的像开源或者一些便宜的服务来搭建存储,从一开始我们就用企业级高端的存储直到现在,这种存储厂商,像日立、EMC等给出的承诺就是永远不丢数据,我们也确确实实在过去这么多年没有出现过丢数据的案例。所以对于数据存储的安全我们是可以保证的。另一个安全,就是我们整个内部的管理,对于内部的管理,我们曾去中国银行的数据中心学习过,现在的金融数据对于每个人来说都是很敏感的。当时我们学到的一个非常重要的运营方式,就是不能把开保险柜的两把钥匙或者能够开这些数据的钥匙交给同一波人。我们执行的方案和这个方案非常像,能碰到数据的人根本不知道数据是谁的。知道数据是谁的人绝不会碰到数据,这样就会保证数据是非常安全的。这就是我们数据的存储安全和运营性的安全,数据安全确实是我们非常重要的一部分。

InfoQ:我们知道首都在线有很多客户是电商的平台,从云平台供应商这个角度来看,你觉得国内现在的电商业务发展是不是有一些新的特点出现?以及它们所需要的那些技术的支撑能力是否也出现了一些新的变化?

郑义:国内电商跟国外电商有非常大的不一样。全球有一个很大的电商叫亚马逊,也是亚马逊让云计算真正的被市场所接受,当时亚马逊的背景是什么?亚马逊每一年会有一个波峰,就是圣诞节,所以它创造了一种商业模式就是卖掉了它平时用不到的服务器,所以真正来说云计算是由电商诞生的。而国内的电商平台,它们的模式跟亚马逊不同,它的波峰出现的次数远远大于国外,对于云计算来说,重要的是如何快速地给他们提供一个他们需要的运营环境。事实也证明了,如果不用云计算,当促销来临的时候很难满足客户需求,所以云计算非常适合电商。

对于云计算供应商的挑战,第一,对于电商来说,供应商必须是中立的,如果不中立,对于电商平台是很难选择的,也有出现过这样的情况,当同样在做促销的时候,有一些不中立的竞争对手,为了保自己服务,停止别人的服务。所以中立的供应商是可以提供相对放心的服务的。第二,我们如何更好地管理硬件,这也是云计算供应商要为电商提供的。

InfoQ:最后一个问题,在基础设施云平台方面,你觉得云平台与云平台之间如何去做差异化竞争,怎么样才能在市场里边站稳脚,关键因素是什么?

郑义:其实关键因素我们内部也在讨论,有一点我们是非常清楚的,就是你不可能为所有客户去服务。比如,你去菜市场卖菜和你去五星级酒店卖菜,你卖的都是菜,但是你做的程度不一样,客户的需求就是不同的。你不可能开一家餐馆什么都可以做到,每一家都有自己的差异,主要是因为他们面对的客户群体不一样。

过去几年,首都在线选择的主要是更专业,需要更高稳定性的客户。市场上也有一些会选择中小型客户,这样我们就会存在一定的差异,这种差异主要体现在产品的交付模式,后台的服务模式以及产品的价格。我们选择以生产型客户为主,所谓生产型客户是指他拿这个平台是盈利的,服务器停止服务一两秒可能都是不允许的,而有一些企业他不需要生产,可能网站瘫痪两天内部都不知道,因为网站不是他收入的主要来源。当我们选择这类客户的时候,我们跟别人的差异会是什么?就是我们需要有强大的服务团队,有7×24小时的团队在跟着这些客户,对于更大的客户,我们需要有大客户服务团队,非常了解他们的IT架构为他们服务,在任何时候有故障的时候,我们会有人处理。这个是由目标客户带来的差异,每个企业选择的目标不同,最后做出来的产品也是不一样的,所以这些差异最终体现在企业的目标。

InfoQ:也就是说首都在线的客户可能更倾向于规模比较大,业务模式更多的这类客户?

郑义:更专业,对它自身,对平台自身的要求更好、更高的一些客户。这是个自然的选择,客户不会把他认为非常重要的东西放到竞争对手那边,所以我刚刚提到的比较重要的是,我们主要针对的是生产型企业以及我们自己保持中立,不会轻易的往更上层发展。云计算、IaaS上面有PaaS,到PaaS就已经比较垂直了,上面还有一层SaaS。今天来看,所有我们的客户都是做SaaS的,每一个互联网公司都是有软件的,Facebook也是在做他的软件,它就是个SaaS服务。我们是在底层做,我们一直保持中立,了解这些客户需要什么,为他们提供服务,我们一直在坚守的一个观点是,我们不想把客户赚的钱赚了,这个是不健康的,这就是我们一直在做的。

InfoQ:就是说不会又是自己的客户,又是自己的竞争对手,不会出现这种情况?

郑义:就像你刚刚提到的云主机的问题,就是一个很好的体现。现在我们有一些做PaaS的客户,这些客户他自己也有客户,一旦我们往上做,比如说我们要做教育平台,要做直播平台,而对于这些客户他自己在做,他必须要选择一个信得过的且中立的平台。如果我们去做了,我们也没有别人专业,所以没有必要跟客户竞争,每个行业要有他自己所生存的一个空间。

嘉宾介绍

郑义,首都在线CPO,曾担任过首都在线海外事业部总监及运维总监。任职期间完成了首都在线云计算平台的初期设计以及实施的工作,完整的经历了首都在线云计算发展的过程。9年英国学习和工作经历,曾担任过BT高级网络工程师,Janet网络部经理以及Maxnett  Ltd CTO。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注