@qinyun
2018-12-20T17:37:43.000000Z
字数 1684
阅读 1277
未分类
个数是个推旗下的一款移动App数据分析产品,利用无埋点技术从用户属性、渠道质量、行业对比等多指标对App进行自定义事件统计和卸载分析功能,前者统计用户埋点的发生次数、时间、变化趋势等,后者可了解App各渠道的卸载数和卸载趋势,同时还能分析卸载的用户流向同类App的数量,预测用户关键行为。
在这个过程中,个数主要运用了可视化埋点和行为预测,在下文中,我们将详细剖析这两种技术。
众所周知,数据埋点采集模式有自动埋点、无痕埋点、可视化埋点,那么,个数为什么会选用可视化埋点呢?个数认为可视化埋点不需对数据追踪点添加任何代码,用户通过设备连接管理台,对页面可埋点的元素圈圈点点,即可添加随时生效的界面追踪点。
可视化埋点解决了埋点成本过大的缺点,它具有以下特性:
零代码,无需代码,节省成本
免更新,新增便捷,无需升级
易测试,圈选测试,实时呈现
换而言之,可视化埋点不仅可以节约企业成本,还可以提高开发人员和运营人员的工作效率。
个数的行为预测主要包括流失预测、卸载预测、付费预测等,它的原理是基于App历史行为数据,构建算法模型,预测用户关键行为,达到用户精细化运营和全生命周期管理的目的。
在这里需要注意的是,个数的行为预测与电商平台常用的个性化推荐不同,后者主要是基于用户近期的行为,如浏览记录、购买记录而推出用户可能需要的东西,而个数是基于App各渠道的卸载数和卸载趋势,更多的是对人群的聚类分析,而非仅仅基于个人的行为。
个数的行为预测主要分为以下几个步骤:
1.找样本,主要是从历史数据库中抽取;
2.特征抽取,将用户与数据库打通,做用户ID匹配;
3.特征筛选,保留相关性高的或有价值的特征;
4.模型训练,将保留下来的特征放到模型中训练;
5.参数优化,如果出来的效果不满意,可以返回调整参数重新走一次以上流程。
在这里,我们需要详细讲解一下模型训练,在模型训练过程中,个数一共用了三种方法,分别是聚类分析、逻辑回归、深度学习。
聚类分析是无监督学习的重要范畴,主要用于个数的分类预测中,它的数据在最开始的时候是没有类别标记的,需要用算法提取出一定的规律,将其分类到不同的类或者簇中,同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性,这就是聚类分析的特点。
个数就是基于全量人群,结合它的安装卸载,以及线上、线下其他的纬度把人群做出归类,然后同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性,预测对象对某类APP的兴趣程度,或者对某类APP的流程情况做个对应关系,整个建模过程就算完成了。
通过机器学习,个推构建了独有的冷、热、温标签,用以分析不同群体的基础属性和行为特征,描绘用户的精准画像,最终运用于智能推送和精准营销。
为了避免机器学习平台建设中出现的常见问题,个数的建模平台会提供相应的IDE以及呈现相应特征的管理系统,同时还能提供标准化的ID匹配服务和数据抽取服务,减少工程师的重复工作。此外,个推提供的打包部署服务和后续监控服务,也能够帮助企业保证平台的顺利运行。
个推表示,想要完成机器学习平台的建设,需要注意三大要点:
只有端到端的平台建设才会真正产生价值,同时,特征工程的数据和代码沉淀需要共享运营。
从成效出发,聚焦痛点,不要盲目跟随行业,做好系统和培训的一体化。
谨慎引入新技术栈。
最后,个数的大数据专家表示机器学习的模型十分复杂,虽然在数据处理上效果非常好,但是结果不可解释,所以需谨慎使用,因为机器学习在某一个场景下得出的数据非常准确,但是换个场景,可能不一定适用。
除了聚类分析和深度学习,个数在流失客户预测上还用到了逻辑回归,个数的专家认为逻辑回归的模型相对深度学习简单一些,而且在特征筛选上处理得特别好,结果好解释,也很稳定,这是它最大的优点,现已广泛应用于银行、工业等行业中。
接下来个数还将进入商品推荐领域,开发精准推荐技术,在这个纬度上,不断挖掘大数据的潜力,并结合客户反馈的数据做进一步的优化,以及客户提供部分的样品数据做更深入的训练学习,大家敬请期待。