[关闭]
@pastqing 2016-01-08T14:00:38.000000Z 字数 2227 阅读 3090

基于某日历app或者微博点赞数据的推荐系统

机器学习


一、背景意义

推荐系统并不是新鲜物,在很久之前就存在。随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用户很难从如此多的信息流中找到对自己有价值的信息。

解决信息过载问题的其中的一个手段就是设计并实施推荐系统。在很多情况下用户的意图不明确,或者很难用清晰的语义表达,甚至连用户自己都不清楚自己的需求。这种情景下解决信息过载,理解用户意图,为用户推送个性化的结果,推荐系统便是一种比较好的选择。

下面简述一下本推荐系统推荐列表构成

以上是我设想的推荐系统的输入和输出。

二、推荐算法总体思路

1.协同过滤

协同过滤是推荐系统中的常用推荐系统算法,但是不同的数据会有的差异化。



2.基于location的推荐(location-based)

对于移动设备而言,与PC端最大的区别之一是移动设备的位置是经常发生变化的。不同的地理位置反映了不同的用户场景,在具体的业务中可以充分利用用户所处的地理位置。在推荐中,可以根据用户的实时地理位置、工作地、居住地等地理位置触发相应的策略。

存在问题:为了保护隐私,APP以及微博允许用户关闭位置信息。


3.互补性推荐

用户可能对某一话题的微博感兴趣,同时想要了解其子话题的内容,因此我们可以构建一个话题与子话题的树, 在计算Item相似度的基础上,根据某话题的孩子结点构建推荐列表。


三、相关数据展示

本数据来源与中华万年历APP部分用户11月份的卡片浏览记录。
下面是中华万年历的截图:
Calandar.jpg-61kB

经过统计本数据共有142671个用户, 共有83830个帖子

下面是数据部分截图:
page_view.png-260.6kB

针对此表数据,我做了一些简单的统计分析。

基于此数据,我打算建模做一个文本挖掘。
我简单提取了关键词,下面是关键词截图
keyWord.png-320.4kB

train.png-253.9kB

11月份用户点赞变化.png-181.4kB

四、目前存在的问题

1. 个人理论知识不足:没有研究过推荐系统,读的论文太少,因此对特定业务数据的如何做推荐,用何种模型都很不清楚。不会抽象。
2.拿到了数据不会分析,或者是分析不到关键点。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注