@gaoxiaoyunwei2017 2019-02-14T06:33:04.000000Z 字数 5568 阅读 1682

一直播千万量级用户推荐系统设计

luna

作者：冯丙见大数据架构师

image.png-48.2kB

一直播现在大家都能看到它的影子，技术上面来讲很多东西都是通用的，可以在这里面借鉴一下，看看是不是有一些在你工作当中可以适用的东西。

从三个方面介绍一下我们的系统，一个是面向我们架构设计，一个是用户画像系统，还有一个是评估推荐系统。
image.png-43.5kB

1、推荐系统架构设计

我们先来看一下推荐系统产生的背景，随着互联网技术发展，信息过载成为普遍问题，信息消费者，从海量信息中找到自己感兴趣的内容比较困难，作为信息生产者，让自己生产的信息脱颖而出，受到广大用户的关注也是比较困难的。这个问题很早之前就已经意识到了，并且有了解决方案。最早的解决方案是以雅虎，后来推出了搜索引擎，因为搜索引擎找到相关的内容给用户，如果用户描述的关键字不准确，或者用户本身没有什么需求，这个时候推荐系统不需要用户描述它的需求，是根据它的历史给用户推荐感兴趣的内容，推荐系统是用来满足用户需求不是很明确的时候，帮用户找到可能感兴趣的内容。
image.png-102.8kB

推荐系统的主要任务就是建立用户和信息之间的联系，一方面帮用户找到他可能感兴趣的内容，同时另一方面把信息呈现在可能对它感兴趣的用户面前，以此达到双方共赢。
解决海量信息过载时用户获取信息效率，解决用户无明确需求时信息获取，长尾物品推荐，满足小众个性化需求，我们现在常见的是个性化推荐，已经成为了各大网站的标配了，再一个app上面的话是中间件存在，一个内容的话，是推荐系统根据模型推荐你内容，同时做一些相关性的推荐，比如说看了又看，买了又买相关性的推荐。或者你买了一个东西，给你推荐和这个东西最相关的，在一些社交网站会推荐一些相似用户或者好友相似推荐。我们会预测到用户感兴趣的话，会给推一些感兴趣的信息。

我们看一下整体流程，过滤出优质内容，去除低速、敏感信息。我们根据用户的兴趣找到他感兴趣的内容，用常用的一些算法找到感兴趣的内容，比如说看了一个美食的视频，就可以把新的视频给你。如果发现你跟某一个人很相似，那个人看过我的视频，你没看过，就可以把这个推荐给你，在这个量级，一个用户很难说一天一次把这些多文章和视频看完，所以我们进行三步走，就是把用户最感兴趣的内容放在最前面，根据用户、物品特征，含量信息预估视频的可能性，根据这个可能性从高到低的排序，把最可能看的推荐给他，经过这一步之后剩下的可能是几十个或者几个了，这个量级用户一次是有可能看完的。

image.png-129.8kB

我们看一下推荐系统的架构，在推荐系统里面用户跟系统有两种交互的场景，右边这个表示的是用户的一些行为数据，比如说观看信息、购买信息之类的行为信息会上报到我们的接收服务里面，缓存到消息推荐里面，后面会做两种方式的处理，一种是用这种数据训练两种模型，用来做后面的推荐用。
image.png-109.2kB