@lsmn
2018-09-03T14:19:27.000000Z
字数 6023
阅读 1526
云计算
OpenStack
混合开放云正在上升为像AWS这样的巨头的替代方案。本文介绍了波士顿儿童医院如何使用这项技术加速诊断和数据处理。
本文要点
- 开放云模型使企业可以在基础设施层面上创新。Massachusetts开放云使顶尖的大学可以和业界在这种共享云上合作共建。
- 开放云正成为昂贵、封闭的专有云如AWS的替代方案,创建了同样的研究、创新和协作场所。
- 医学研究特别适合通过开放式混合云进行实时协作。把开源的可扩展性和共享性运用到医疗上,可以把图像处理时间从几小时缩短到几分钟,从而节省成本。
- 除了上述成本节省外,应用场景仍然是基础设施决策的推动因素。
- 借助开放云,你不仅可以把应用程序调整到云上,还可以调整云满足应用程序的要求。
开源软件的流行似乎会一直持续下去,而专有云合约通常运维成本较高而且不灵活,混合开放云模型上升为像AWS Web Services这样的巨头的一个有前途的创新替代方案。本文将深入介绍一个引人注目的的端到端案例,就是波士顿儿童医院放射科如何利用Red Hat开源的、基于容器的技术以及Mass开放云,通过更快地诊断和处理来改善患者的治疗效果。
“基本的思想是都是由提供商控制的、专有且封闭的东西。”
Orran Krieger是波士顿大学哲学博士及Mass开放云负责人,这是他在接受采访时对这个项目的动机的一个简单总结。
Krieger表示,他们的设想是有多个云提供商在一个共享云中部署了不同的服务,创建一个公平的竞争环境。把麻萨诸塞州的学术大鳄如Harvard和MIT聚在一起,使一部分世界上最大的研究机构合并资源,构建一个15兆瓦的数据中心,他们可以在这里数据中心里部署一个共享的开放云,称为Massachusetts开放云或者Mass开放云或简称为MOC。
Krieger说,“对于希望在基础设施层面创新甚至是管理它的公司,开放云模型真得非常有好处。”他已经见证了类似波士顿儿童医院放射科项目的服务基于它构建。
“运行试验的成本相当高。当你是一所非营利性的大学时,成本就更高了,在一个规模足够的云上启动任何东西都需要巨大的资金投入。”
Krieger认为,对于大学而言——至少在美国是如此——购买自己的设备总是比租用私有云服务器便宜。
但是,他也说,“如果业界参与的话,最终,成功只会来自像开放云这样的东西。”
Krieger表示,只有所有这些大学都聚在一起,才能为创建一个规模足够在上面进行试验的云提供必要的资金投入。此外,他还说,早在现如今的公有云之前,大学已经有一段很长的部署大规模计算基础设施的历史了。
一旦他们参与进来,令人信服的端到端案例就推动项目向前发展,包括和Red Hat一起根据项目反馈和需求改造底层技术和云。
最终,重要的是节省成本,但是,技术项目的发展是由故事推动的。对于儿童医学影像更快的响应无疑就是那种令人信服的案例。
Rudolph Pienaar是一位哲学博士,波士顿儿童医院资深科学家,哈佛医学院放射学导师,同时也是这个项目的技术架构师。他使波士顿儿童医院和Mass开放云建立起伙伴关系,实现了一个端到端的案例。其中,Mass开放云和Red Hat基础设施部门存在合作伙伴关系。
Pienaar介绍了他们试图解决的问题:
“我们如何才能非常快速得分析放射数据,我们如何才能非常容易地做到那一点,使使用系统的人只需要付出最少的努力?鉴于我们是在架构一个数据主要在云计算上分析的基础设施,我们需要尽可能地隐藏这种复杂性。用户需要的仅仅是选择一个数据集,然后选择要对数据进行什么样的分析。至于数据如何打包、防护、去标识化,如何遵从合规性标准,如何发送到云上并分析,最终如何取回结果并展示给用户,这些细节,终端用户从来都不需要考虑。当然,这仍然是一个复杂的问题。”
他们给出的答案就是ChRIS研究集成服务,一个基于Web的医疗图像平台,使用了多种BCH自主开发的软件进行开发,然后在Mass开放云上借助Red Hat的技术进行了“无缝集成”。ChRIS提供了一种部署成像应用程序的标准方式,这会减少当前存在于医疗应用开发人员和诸如医疗卫生技术人员这样的用户之间的障碍,这些用户需要快速访问工具,但具备的技术知识很少。ChRIS在Red Hat OpenShift kubernetes容器平台上运行,所以,为ChRIS构建的应用容器自动存储了用户所需的所有库,他们从安装应用到开始处理医疗图像的时间有时候可以从几小时缩减到几分钟。
他们的成像应用场景是一个计算密集型过程,需要访问GPU(图形处理单元),使用MOC硬件及Red Hat OpenStack。
Pienaar表示,这意味着Red Hat必须“改变云来适应应用程序,改变应用程序来适应云。我觉得,看着云基于这个项目的反馈来发展演化令人兴奋。”
当你为没有很深技术背景的用户构建应用程序时,采用一种简单直观的方式至关重要。Pienaar表示,对于儿童医院而言,这是一种非同寻常的尝试,因为虽然临床医生对研究非常感兴趣,但是,“他们在如何启动Linux终端及如何分析数据时并不是非常熟练”。
为了做到这一点,他们必须客服一些运营方面的挑战,其中包括对复杂且古老的数据的多样化、分散式访问。从儿童医院创立至今将近150年的时间里,已经有了一个巨大的信息库,但是,这些数据通常分散在孤立的实验室里。这些数据需要清理和匿名化,以便可以跨越网络边界移动数据,同时保持合规性。还需要一个用户界面,使像放射科医生这样的用户可以有一个巨大的数据库用来分析。
Pienaar还补充了另外一个问题,他们的软件通常是由博士后在与计算机有关的实验室里编写而成的,但是,通常只有在结果收集完成而论文已经发表之后,因此,几乎不会跨部门共享,或者,很长一段时间内不会共享。
有些人,如临床医师,他们可以从比较影像结果中获得巨大收益,尤其是利用他们背后的大数据,但是,他们通常几乎没有机会访问所有这些研究和影像。不要忘了,因为它的高度敏感性和高度隐私性,医疗行业是监管最严格的行业之一。这个项目的一部分就是努力实现这些数据的整体共享,同时要特意隐藏那些作为标识的数据点。现在,ChRIS正预把那些数据安全地移到云上,在那里收集、分析和可视化。
Pienaar指出,所有东西都是开源的,那非常重要,再说一遍,不仅仅是为了节省成本。他从项目一开始就一直在使用Linux,他认为,如果他们被绑定到专有云上,那么他们就无法使用他们希望使用的另开一种开发环境和语言。
Pienaar说,“借助这些开源方法,我们可以构建真正可以对数据产生影响的东西,而这些数据真正链接了其背后的世界,这个想法使我大受启发。”
“现在,如果我们要在Amazon云上深入合作下去,那么我就会想到,我们必须同Amazon达成许可协议。我无法下载Amazon云并在自己的环境里运行。由于ChRIS的全部能力都源自它与Mass开放云的连接,所以没有什么能阻止你下载ChRIS并且就在自己的笔记本上运行。整个ChRIS都可以使用。你获得的体验是完全相同的——虽然你的笔记本完全无法承受巨大的计算量。而且,你完全可以在自己小而完整的ChRIS上分析问题和开发,然后通过单击部署到云上其他任意数量的‘ChRIS’上。”
他说,他们当然也在和合适的大牌医疗技术供应商合作开展项目,但是,在这些情况下,开发周期和开发加速度都由于专有技术而慢一个等级,因为“完全隔离的沙箱”和“非常拘束的边界”。
Pienaar举了一个例子,当他需要在专有云环境中部署应用或数据时,“我无法自己推送——我不得不获取许可或者使用专有API。而且,一旦部署,我就无法再访问它。他们可能在云上提供了我不知道是什么的服务。”
他又举了一个更具体的Python库的例子,该库需要与云上的Amazon实例通信,使用证书进行身份验证。
“我总是害怕,Amazon下周会推出另外一个版本的API,改变数据的某个方面,或者做一些相关的调查。”Pienaar说,这是双向的:“如果我不再喜欢Amazon,我就会希望能够在本地机器上实例化[启动]我的整个服务。”
他表示,借助开源,他的团队唯一受限制的地方是时间和精力。
“借助Red Hat的OpenStack和OpenShift,我可以在任何地方做。我们可以在自己的实验室中启动我们的基础设施,有些医院,他们可能特别不放心把数据放在其他地方,甚至是Mass开放云,他们可以在内部使用同样的经验和所有的透明度控制。那么,你为何不采取措施考虑去到Mass开放云上。”
Pienaar认为,全开源技术栈使他们具备了更强的能力,但有着同等的控制权。
Hugh Brock是Red Hat波士顿大学项目的负责人,在过去的9个月里,他负责把Red Hat一方的工作准备就绪,并在Mass开放云上运行。他说,他们对这种应用场景非常感兴趣,该场景涉及像快速图像处理这样的密集计算,需要使用类似Red Hat OpenStack平台这样的Red Hat软件访问GPU。
他说,“在Red Hat,我们希望可以展示我们如何帮助人们围绕这类问题创建一个社区,[那样我们可以]设法使我们的软件更便于社区开发人员使用,尽量帮助他们了解他们可以做什么贡献。”
Brock说的社区用户是指那些从事医疗图像如神经影像处理的用户,以及那些开发一点代码并希望在云上而不是本地机器上进行测试的用户。同时,也有些人是希望借助Mass开放云和容器基础设施软件节省资金,医疗场景迫使他们希望使其更易于分发,按照他的说法,这是Red Hat OpenShift促成的。
当问到,是否人们在上面开发的应用都必须开源时,Brock说那不是必须的,但是,尽管如此,他所知道的神经影像领域的每个人都使用开源方法,从而避免落入“许可陷阱”。
在Red Hat,“我们已经准备好了Mass开放云,从建立之初,它就一直运行在Red Hat OpenStack和Red Hat OpenShift上。当我们开始了解到ChRIS项目时,我们意识到,这对于容器和OpenShift是一个非常好的展示机会。”
他们下一步会做什么?
Brock继续说道,“我们希望指出的是,在我们的云软件上,不仅图像处理代码可以运行得更快,也有其他一些东西会运行得更快,像跨不同的医疗数据集进行分组运算,加密安全数据而没有数据的完全访问权,利用影像库中可用的开放数据,如扩散的肿瘤细胞。”
“随着数据量越来越大,我们生成的数据越来越多,对于研究人员而言,能够以一种安全而不侵犯隐私的方式使用那些数据变得越来越重要。”
Brock说,“如果你必须为了访问他们已经挖掘的医疗数据而向一个大型云付费,那么就会断送第三方访问那些推测性数据的机会,他们可能不希望付费。”这是另一个令人信服的基于混合云进行构建的理由。
在Red Hat,他们既注重数据的开放访问,同时也控制受隐私约束的数据的访问。
ChRIS借助Red Hat OpenShift kubernetes发行版在Mass开放云上运行。据Brock介绍,ChRIS可以在原始的栈上运行,但是,为了提升速度,他们做了一些额外的工作,传递给来自硬件的GPU。
“在Mass开放云上,我们有一个集群的所有机器都有GPU卡——那个卡可以从硬件传递给虚拟机。当你运行其中的一段图像处理代码时,如果它针对GPU处理进行了优化,那么它就可以运行得更快——从几天到几个小时。”
计算机科学博士Ata Turk领导着Mass开放云的大数据和医疗保健分析团队。对于这个合作项目,他的目标是向每个人提供医疗保健服务。他说,容器已经成为实现这个目标的一个关键部分,因为应用开发人员可以使用和运行多个容器,组织他们的输入、输出,并提供给其他开发人员。
Turk说,“Red Hat OpenShift以Kubernetes为基础——那使得我们可做多租户,和存储设施通信,以OpenStack为基础构建。在管理方面,OpenShift针对DevOps和kubernetes做了很好的打包。容器使我们可以把它提供给所有的应用开发人员,使他们可以基于医院的真实数据运行。”
Turk举了他妻子Esra Abaci Turk的例子。她是波士顿儿童医院的一名研究员,研究怀有双胞胎的妇女的子宫供氧问题,这是一个关于胎儿大脑发育和成长的重要问题。她已经收集了来自BCH的9个案例和来自麻萨诸塞州其他医院的6个案例,但是,目前没有技术或监管方法使这些实体可以共享数据。
还有另外一个潜在的应用场景(如附图所示),该作者15个月大的孩子是人脑发展项目(dHCP)的匿名贡献者,该项目的目标是绘制大脑发展图谱。目前,这包含一次孕期32周时的MRI,另外一次是出生第二天。对于新生儿,他们可以让这个机械世界变得安静,但是,在对婴儿因为受到刺激而非常活跃的大脑生成快照时,这就不可能了。Turk表示,需要花“好几个小时”的时间才能把那些MRT图像分层存储,消除移动噪声。借助并行计算和云,ChRIS可以非常快速地处理这一切。
类似地,围绕特定的主题收集匿名数据可以拯救生命,不管是发现肿瘤转移模式,还是分析马萨诸塞州五个最顶尖的创伤中心在应对2013年波士顿马拉松爆炸事件过程中针对不同情况所做的处理和跟踪。
“这些问题有推动策略和决策的意义与价值,我们为此正在构建一个平台。”Turk解释说,现在“我们有了这个框架,可以使人们分享来自不同实体的数据,而这些实体本身并不想分享数据”,实际上,这种分享符合监管标准,同时也无损于研究。
这种合作中还有医疗健康之外的应用场景。Turk举了一个例子,企业希望了解男女之间工资差异,但又不想暴露工资数据本身。基于ChRIS、Red Hat技术栈和Mass开放云构建的应用程序可以聚合超过500家波士顿公司的工资数据。现在可以讨论缩小薪酬差距的方案了,因为现在已经积累了丰富、可靠的数据。
该场景和医疗场景都遵循同一种操作模式,引入数据和代码,在最佳数据量上运行,分享输入数据和应用程序本身所需的临时数据。ChRIS还提供了机制,便于为临床医师可视化数据。
最终目标不只是使应用程序在单台机器上运行得更快,而是开源数据本身,同时保持合规性,如美国的HIPAA和欧洲的GDPR。
你在哪里见过开放云?请在下面的评论中告诉我们。
Jennifer Riggins是一名科技故事讲述者兼撰稿人,当数字化转型遇到文化,她希望可以让世界变得更美好。她的Twitter账号是@jkriggins。 |
查看英文原文:How the Boston Children’s Hospital Is Innovating on Top of an Open Cloud