[关闭]
@dtstudy 2016-09-19T14:02:13.000000Z 字数 1218 阅读 1548

大数据与机器学习周报 第25期:谷歌开源大规模语言建模库

大数据 数据挖掘 机器学习


业界新闻

  1. 谷歌开源大规模语言建模库,探索RNN极限:近日,谷歌宣布开源大规模语言建模模型库,这项名为“探索RNN极限”的研究今年2月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试取得了极好的成绩,另外开源的数据库含有大约10亿英语单词,词汇有80万,大部分是新闻数据。这是典型的产业研究,只有在谷歌这样的大公司才做得出来。这次开源也应该会像作者希望的那样,在机器翻译、语音识别等领域起到推进作用

  2. MIT最新发布编程语言Milk,加速大数据时代并行运算:本周MIT最新发布新编程语言Milk,新的程序语言在大数据方面能实现比现有语言快四倍的处理速度

  3. Twitter 开源增强学习框架Torch-twrl ,可与OpenAI无缝对接:借鉴其他的增强学习框架,torch-twrl希望提供:一个在Lua/Torch中的、拥有最小函数依赖的增强学习框架;定义清晰的、模块化的代码带来的快速开发;与Open AI 的增强学习基准框架Gym 的无缝对接

技术干货

  1. 从MySQL到Kafka,如何管理每天实时发布的几十亿条消息?:当你的系统每天要实时从MySQL到Kafka发布几十亿条消息时,你会怎么管理这些数据的模式信息呢?当你的系统要接入几百个服务时,你就要处理几千种不同的模式,手工管理是不可行的。必须有自动化的方案来处理从上游数据源到所有下游消费者的模式改变问题。Confluent公司的Schema Registry和Kafka Connect都是不错的选择,可惜当我们开始构建Yelp数据管道时它们还没发布。因此就有了我们的Schematizer

  2. 腾讯亿级排行榜系统实践及挑战:排行榜满足了人的攀比、炫耀心理,几乎每个产品都会涉及。SNG增值产品部的QQ会员、QQ动漫、企鹅电竞、游戏赛事等大量业务都对排行榜有强烈需求,特别是企鹅电竞等业务的发展壮大对我们排行榜系统提出了更多要求和挑战

  3. 百分点亿级个性化推荐系统的发展历程和实践架构:百分点个性化系统开始于2009年,是百分点公司的第一个产品,也是一直延续至今的产品。个性化系统以电商推荐为切入点,涵盖电商、媒体、阅读、应用市场等领域,以第三方技术服务的形式为企业提供个性化推荐服务

深度观点

  1. 深度 | 主流深度学习框架对比:看你最适合哪一款?:近日,Deeplearning4j 在自己的官方网站发表了一篇对比 Deeplearning4j 与 Torch、Theano、Caffe、TensorFlow 的博客文章,同时 Deeplearning4j 在文章中也对自己的框架进行了较为详细的介绍(多有溢美之词)。机器之心对全文进行了编译,文中观点仅代表原作者立场

  2. 郭炜:大数据领域缺的是分析人才:本文嘉宾在智能硬件以及大数据分析领域具有丰富的理论和实践经验,多次在CIO论坛、O2O论坛、创业论坛发表相关演讲,在传统行业和互联网行业享有良好的声誉

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注