@no13bus
2016-09-18T14:54:21.000000Z
字数 1706
阅读 1265
姨搜
大数据
宜信
这篇文字主要是通过微信里面的一些公号文章总结下宜信能够实现快速秒批的核心系统-姨搜的技术架构和涉及到的相关技术.希望能给自己和风控一些启发, 提高消费金融的核心-风控系统的时效.
实时授信或者辅助信审人员进行授信,甄别用户
在姨搜出现之前,信审人员的工作是这样的:
有了姨搜之后,他们的工作是这样的,只需要在姨搜系统里输入申请人的身份证号码,即可获得与申请人相关联的数据,如下:
姨搜以网查为切入点,密切配合宜信各条业务线的特点和需求,积极、高效提供风控数据的一站式服务。姨搜的爬虫覆盖了100多个公开网站(如人法、工商、百度、生活服务类、十几家网贷黑名单等),能支持单日百万个query的爬取
反欺诈.
在姨搜出现之前,反欺诈人员的工作是这样的:
他们需要根据借款人提供的信息,查找多方面资料,进行不同属性的比对,从而发现“羊群中的狼”。这种工作复杂而枯燥,为了识别团伙欺诈,往往需要收集、整理、分析各种维度的数据,工作量更是成倍增加。
有了姨搜之后,他们的工作是这样的:
姨搜依托搜索技术中最先进的知识图谱技术,把每个客户的信息、宜信过往客户的信息以及网络上公开的信息织成一张巨大的关系网,并通过可视化的图形将这种关系展示出来。结合反欺诈部门多年来积累的实战经验,图谱搜索能快速的找出来存在欺诈的客户.
金融获客(给BD同学推送有价值的用户)
首先是数据的获取. 姨搜的数据来源包括:
其次进行数据的去噪
数据去噪是特别具有技术挑战的难题,需要花很大的精力去做数据的去噪。除了技术手段要高,机器学习的能力要比别人强,还有一个关键的方面,就是要用多个数据源去交叉验证。有些时候,在技术不完全能解决的情况下,就要线上线下相结合,进行验证。
关于数据整合后如何使用看下图: