[关闭]
@qinyun 2018-12-20T17:37:43.000000Z 字数 1684 阅读 1241

个数是如何用大数据做行为预测的?

未分类


个数是个推旗下的一款移动App数据分析产品,利用无埋点技术从用户属性、渠道质量、行业对比等多指标对App进行自定义事件统计和卸载分析功能,前者统计用户埋点的发生次数、时间、变化趋势等,后者可了解App各渠道的卸载数和卸载趋势,同时还能分析卸载的用户流向同类App的数量,预测用户关键行为。

在这个过程中,个数主要运用了可视化埋点和行为预测,在下文中,我们将详细剖析这两种技术。

可视化埋点

众所周知,数据埋点采集模式有自动埋点、无痕埋点、可视化埋点,那么,个数为什么会选用可视化埋点呢?个数认为可视化埋点不需对数据追踪点添加任何代码,用户通过设备连接管理台,对页面可埋点的元素圈圈点点,即可添加随时生效的界面追踪点。

可视化埋点解决了埋点成本过大的缺点,它具有以下特性:

换而言之,可视化埋点不仅可以节约企业成本,还可以提高开发人员和运营人员的工作效率。

行为预测

个数的行为预测主要包括流失预测、卸载预测、付费预测等,它的原理是基于App历史行为数据,构建算法模型,预测用户关键行为,达到用户精细化运营和全生命周期管理的目的。

在这里需要注意的是,个数的行为预测与电商平台常用的个性化推荐不同,后者主要是基于用户近期的行为,如浏览记录、购买记录而推出用户可能需要的东西,而个数是基于App各渠道的卸载数和卸载趋势,更多的是对人群的聚类分析,而非仅仅基于个人的行为。

个数的行为预测主要分为以下几个步骤:

1.找样本,主要是从历史数据库中抽取;

2.特征抽取,将用户与数据库打通,做用户ID匹配;

3.特征筛选,保留相关性高的或有价值的特征;

4.模型训练,将保留下来的特征放到模型中训练;

5.参数优化,如果出来的效果不满意,可以返回调整参数重新走一次以上流程。

在这里,我们需要详细讲解一下模型训练,在模型训练过程中,个数一共用了三种方法,分别是聚类分析、逻辑回归、深度学习。

聚类分析

聚类分析是无监督学习的重要范畴,主要用于个数的分类预测中,它的数据在最开始的时候是没有类别标记的,需要用算法提取出一定的规律,将其分类到不同的类或者簇中,同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性,这就是聚类分析的特点。

个数就是基于全量人群,结合它的安装卸载,以及线上、线下其他的纬度把人群做出归类,然后同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性,预测对象对某类APP的兴趣程度,或者对某类APP的流程情况做个对应关系,整个建模过程就算完成了。

深度学习

通过机器学习,个推构建了独有的冷、热、温标签,用以分析不同群体的基础属性和行为特征,描绘用户的精准画像,最终运用于智能推送和精准营销。

为了避免机器学习平台建设中出现的常见问题,个数的建模平台会提供相应的IDE以及呈现相应特征的管理系统,同时还能提供标准化的ID匹配服务和数据抽取服务,减少工程师的重复工作。此外,个推提供的打包部署服务和后续监控服务,也能够帮助企业保证平台的顺利运行。

个推表示,想要完成机器学习平台的建设,需要注意三大要点:

最后,个数的大数据专家表示机器学习的模型十分复杂,虽然在数据处理上效果非常好,但是结果不可解释,所以需谨慎使用,因为机器学习在某一个场景下得出的数据非常准确,但是换个场景,可能不一定适用。

逻辑回归

除了聚类分析和深度学习,个数在流失客户预测上还用到了逻辑回归,个数的专家认为逻辑回归的模型相对深度学习简单一些,而且在特征筛选上处理得特别好,结果好解释,也很稳定,这是它最大的优点,现已广泛应用于银行、工业等行业中。

未来

接下来个数还将进入商品推荐领域,开发精准推荐技术,在这个纬度上,不断挖掘大数据的潜力,并结合客户反馈的数据做进一步的优化,以及客户提供部分的样品数据做更深入的训练学习,大家敬请期待。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注