@lsmn
2016-04-15T20:36:40.000000Z
字数 1272
阅读 2727
Apache
Storm
1.0版本是Apache Storm发展过程中一座重要的里程牌,负责Apache Storm项目的Apache软件基金会副总裁P. Taylor Goetz这样写道。该版本包含许多新特性和改进。尤其是,Goetz声称它带来了3到16倍的性能提升。
1.0版本是Apache Storm发展过程中一座重要的里程牌,负责Apache Storm项目的Apache软件基金会副总裁P. Taylor Goetz这样写道。该版本包含许多新特性和改进。尤其是,Goetz声称它带来了3到16倍的性能提升。
Storm是一个事件处理程序,可以对流数据进行分布式处理。一个Storm应用程序由“spouts”和“bolts”构成,它们被配置成一个有向无环图,用来表示信息源和数据处理程序。Storm的主要特点是能处理实时数据,不像Hadoop那样允许批处理。
据Goetz介绍,与先前的版本相比,Storm 1.0的性能最高提升了16倍,在大多数情况下预计都会有3倍的性能提升。特别地,性能的重大改善似乎来自下面的更改:
SpoutOutputCollector.emit()
调用中使用Java重新实现了Clojure reduce
函数;DisruptorQueue
中引入批处理,代替spout层的批处理,这以增加延迟为代价大幅提升了吞吐量。特别地,雅虎工程师所做的大量的基准测试表明,与其他两个流行的分布式处理框架Apache Flink和Apache Spark相比,性能历来是Storm的主要竞争优势之一。
此外,Storm 1.0包含许多值得注意的新特性,例如:
读者可以从GitHub上下载Apache Storm 1.0,或者从Storm下载页面上获取各种打包格式。
查看英文原文:Apache Storm Reaches 1.0, Brings Improved Performance, Many New Features