@pastqing
2016-04-01T08:21:08.000000Z
字数 889
阅读 2201
机器学习
我的目标是基于用户的关注的, 评论的微博话题,来给用户进行推荐相关性的,互补性的话题。
对于话题的推荐,我想到的工作大体分以下几块:
相关论文:基于隐含语义分析的微博话题发现方法
相关论文:
Discoving Event Evolution Graphs Form News Corpora
LDA 模型在话题追踪中的应用
微博客.热点话题发现策略研究
相关论文:
有限节点驱动的微博社会网络话题推荐方法
根据微博数据的语义来挖掘话题。从类似于微博这种社交网络的数据,它们的语义比较随意,提取特征值不能很固定。 因此针对微博数据,需要额外考虑传统基于匹配关键词来发现一些高频话题的办法之外的策略。
一般的发现话题的核心过程是聚类, 通过阅读论文,我觉得要用多种聚类方法组合来解决发现话题的问题。比如基于隐含语义分析的微博话题发现方法这篇论文就是利用CURE和K-means结合的两个阶段的聚类的方法, 来提高话题的发现率,从而实现推荐。
基于隐含语义分析的微博话题发现方法在向量空间模型的基础上处理词条关系,试图跨越对自然语言的理解,运用统计的方法来发现词语使用过程中潜在的语义结构,用概念取代关键词,从而削减了词语和文档间的语义模糊度,在一定程度上缓解了向量空间模型中同义词、多义词的影响,提高了话题发现的精度。
我想做的是对于微博的某个话题,能给用户推荐出来相关性的,相补性的话题。相关性可以通过对此话题和其子话题进行多次聚类策略完成。
关于相补性话题:我的想法是通过已有的话题中的微博,提取关键词,然后计算跟已有的话题的相似度或者再聚类,从而推荐给用户。例如用户关注了微博时尚说这个话题:
从这个话题下,有很多微博,例如:
从这个微博,我们或许可以给用户推荐一些电影的微博。
由这个想法,就是想通过用户关注的话题下来搜索其他话题,从而完成推荐。有一篇参考论文是:
基于线索树双层聚类的微博话题检测