@qinyun
2019-02-14T15:14:23.000000Z
字数 2415
阅读 2615
未分类
在移动互联网时代,大数据技术的出现为企业数字化运营加了一把火,也让用户的行为在企业面前变得可视化和可预测,随之为企业带来巨大的商业价值和经济效益,大数据一度成为风口。就在此时,“用户画像”的概念也应运而生,它是指在大数据时代,由于用户信息大量涌入网络,我们需要将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。在下文中,我们将以“个像”为例,为您详解用户画像的技术特点和使用价值。
个像是在个推的基础上,结合个推强大的大数据能力,为APP开发者提供丰富的用户画像数据以及实时的场景识别能力,进而帮助客户了解用户信息,从而助力移动APP目标用户精准筛选、个性化推送消息和应用更新下载等。
用户画像的形成需要经历四个过程,主要包括数据收集、数据清洗、数据建模分析、数据产出。其中,在数据收集阶段,个推的数百亿sdk覆盖数十亿的终端,能够提供海量数据支持。数据清洗和数据建模统称数据处理,数据处理再加上数据产出形成用户画像。
在数据处理阶段,个像的大数据计算架构采用Kafka分布式发布订阅消息系统,具有高吞吐量、高稳定性的特点,数据清洗利用HADOOP、SPARK实现设备唯一性识别、行为数据的清洗等,支持交互计算和多种复杂算法,同时,它还支持数据实时/离线计算,最终的目的是去除冗余数。
在数据建模过程,主要用了机器学习中的聚类(无监督学习)和深度学习技术,它能让模型对用户行为数据主动学习,进行行为判断,产出用户标签。
之后,数据的产出会形成冷数据画像、温数据回溯、热数据场景和定制化标签四种画像。
冷数据画像也称冷画像,是指基于大数据分析出用户的属性,改变的概率较小的数据,如用户的年龄层次、性别。
“温数据”则可以回溯用户近期活跃的应用和场景,具有一定的时效性。
“热数据”是指用户当下的场景及实时的用户行为,帮助APP运营者抓住稍纵即逝的营销机会。
定制化标签是将个推数据与第三方数据结合起来,共同建模得出具有价值的特征标签。总的来说,个数不仅有通用的标签维度,也有定制化标签的输出能力。
用户画像的构建需要技术和业务人员的共同参与,以避免形式化的用户画像,具体做法可参考如下流程:
(1)标签体系设计。开发者需要先了解自身的数据,确定需要设计的标签形式。
(2)基础数据收集、多数据源数据融合。个推在建设用户画像时,会接入来自个推和品牌等多个数据源的数据。
(3)实现用户统一标识。多数情况下,APP的众多用户分布于不同的账号体系中,个推会将其统一标识。
(4)用户画像特征层构建。即将每一个数据进行特征化。
(5)画像标签规则+算法建模。两者缺一不可,在实际的应用中,算法难以解决的问题,利用简单的规则也可以达到很好的效果。
(6)对所有用户进行算法打标签。
(7)画像质量监控。在实际的应用中,用户画像会产生一定的波动,为了解决这个问题,个推建设了相应的监控系统,对画像的质量进行监控。
总之,个像用户画像构建的整体流程,可以概况为三个部分:
第一,基础数据处理。基础数据包括用户设备信息、用户的线上APP偏好以及线下场景数据等。
第二,画像中间数据处理。处理结果包括线上APP偏好特征和线下场景特征等。
第三,画像信息表。表中应有四种信息:设备基础属性;用户基础画像,包括用户的性别、年龄层次、相关消费水平等;用户兴趣画像,即用户更有兴趣的方向,如用户更偏好比价类APP还是海淘类APP;用户其它画像等。
在个推用户画像构建的过程中,机器学习占据了较为重要的位置。机器学习主要应用在海量设备数据采集、数据清洗、数据存储的过程。
用户画像常用在电商、广告等领域,具体表现为电商领域的精准推荐和广告行业的精准推送。
基于特征的推荐
APP的运营者通过个像提供的性别、年龄段、兴趣爱好等标签,分别展示不同的内容给用户。以达到精准化运营,千人千面的目的。
基于内容的推荐
基于内容的推荐是指找到与目标相似的用户群,利用该用户群的行为特征对目标用户进行内容推荐,具体过程如下图:
在这里,我们重点解释一下相似性建模,相似性建模同等于聚类建模,它是无监督学习中的一种,它指的是寻找数据中的特征,把具有相同特征的数据聚集在一组,赋予这些聚集在一起的数据相同的特征标签,从而给这些具有这些特性的用户推送相同的内容。
这种推荐方式的优点是,它的自有特征是经过APP长期积淀而来,粒度更细,适用性更强,对用户的认识更全面,效果能持续提升,而且它还能针对APP所处行业与自身需求,量身定制匹配算法,让推荐更精准。
正如上文所言,个像能够结合第三方数据做定制化建模,主要原理是个像大数据结合三方数据,双方共同建模得出显著价值和特征标签,依据不同标签向用户推送不同内容的广告。这样,不仅能保证推送的内容更精准,覆盖的客户面和App也更广泛,这种标签增补的方式,可以很大程度上提升流量价值。
个像的接入主要有两个方式:
具体的集成文档参见以下链接:
Android:http://docs.getui.com/gexiang/start/android/