[关闭]
@dtstudy 2016-08-29T13:53:53.000000Z 字数 1418 阅读 1610

大数据与机器学习周报 第22期:Facebook 开源快速文本分类工具fastText

大数据 数据挖掘 机器学习


业界新闻

  1. Facebook图像识别很强大,一次开源三款机器视觉工具:Facebook的图像识别功能一直为人所赞叹,也是一些专业人士介绍相关技术的范例。继开源了文本分类工具fastText之后,今日,Facebook 官方发布博客称开源DeepMask分割构架、SharpMask分割精炼模块、MultiPathNet 的代码

  2. 为对抗亚马逊AWS,SAP以1.25亿美元收购Altiscale:据外媒报道,德国企业软件公司SAP正在进行对大数据创业公司Altiscale的收购事项,交易金额预计超过1.25亿美元

  3. GitHub为MySQL社区贡献了新的在线更改表定义工具gh-ost:本月初,GitHub数据库基础架构组的高级软件工程师Shlomi Noach在GitHub Engineering网站上发文宣告了gh-ost的开源发布。这对MySQL社区是一件大事,宣告停滞许久的MySQL表在线修改表定义操作又有了新的解决方案

技术干货

  1. 基于大数据的全球电商系统架构性能优化:传统的性能优化往往只注重一个技术指标, 最终的业务结果很难量化。本次演讲向大家介绍一个基于大数据准确度量性能对电商业务的回报的方法。也就是说,任何一个微小的局部性能优化(investment)带来的新增订单(return)可以被精确估算出来

  2. 阿里云的云计算与大数据(33张PPT):随着劳动人口增长率、资本回报率持续下降,倒逼中国企业创新转型。过去靠降低价格促进生产和消费的模式,正在向吃掉“消费者剩余”,每个产品都是限量版转变。过去大工业时代靠大规模同质化生产,只能卖到均衡价格,而互联网时代个性需求信息可获得,产品定制化,可以卖到消费者可承受、又不花冤枉钱的价格上限。目前低效率行业仍然较多,数据增效空间巨大。数据经济成为越来越重要的经济增长引擎

  3. 利用Akka,PayPal如何仅用8个虚拟机缩放至日处理数十亿事务:传统方式下日处理十亿笔事务的系统可能需要数百台虚拟机,PayPal只用8台虚拟机就做到了这一切,CPU占用率高达90%时依然可以提供快速响应,这种PayPal以往从未达到的事务处理密度,实现过程所需时间只是传统方法的1/10,在降低成本的同时无须为计算基础架构扩容即可帮助该组织顺利应对增长。这是怎么做到的

深度观点

  1. 对话Hadoop之父Doug Cutting|大数据和开源的未来:对中国大数据产业来说,2016年是从垂直领域野蛮生长到爆发全国范围关注热潮的一个转折点。不论是人山人海巨头云集的贵阳数博会,还是首次在华举办的全球顶级大数据会议Strata + Hadoop World,都揭示了中国大数据产业发展的澎湃动力

  2. 数据治理十年架构师告诉你,元数据为什么适用于微服务:企业IT架构已经发展了多个阶段,在SOA阶段主要解决应用间集成问题,但随着企业业务的发展,单个应用逐渐成为“巨石型”应用,既难以扩展又难以维护。微服务架构将“巨石”应用拆分成为多个服务,以微服务为单独单元进行开发运营,专注于单个应用

  3. 【286页干货】一天搞懂深度学习(台湾资料科学年会课程):本文是2016 台湾资料科学年会前导课程“一天搞懂深度学习”的全部讲义PPT(共268页),由台湾大学电机工程学助理教授李宏毅主讲。作者在文中分四个部分对神经网络的原理、目前存在形态以及未来的发展进行了介绍

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注