@77qingliu 2018-05-13T00:55:54.000000Z 字数 1850 阅读 1916

评分卡的开发过程

信用评分

标准评分卡

评分卡的类型和目的

评分卡主要分为两种类型：
1. 申请评分卡，主要对新贷款进行筛选并判断其违约风险
2. 行为评分卡，对审批通过的贷款账户进行整个周期的管理

申请评分卡用来对新贷款申请进行评分，其评分结果将决定以下几个方面：

估计信用状况，并据此决定批准还是拒绝
为了获得审批通过需要提供的抵押物
贷款金额（信用额度）
贷款定价（利率水平）

行为评分卡用来对已经通过审批的账户，进行信用评分。评分过程将反复进行，以监测和管理业务账户。评分结果将用于：

审查信用重建
审查信用额度
制定清收策略
审查贷款定价和贷款条件

两种评分卡都遵循同样的方案。但是，两种评分卡开发过程中也存在两个主要的差别：

通常行为评分卡要比申请评分卡更精确。
拒绝演绎技术只有在申请评分卡的开发过程中使用

“正常”、“违约”和“不确定”

评分卡的目的是按照一定的标准分配分数，从而确保违约率高的账户的得分一定低于表现正常的账户。

通常，正常和违约的概念是主观的并取决于企业。但是，大多数评分卡的开发都是基于60天、90天或180天逾期。

通常状态变量分别用1表示违约、0表示正常。

不确定状态介于违约和正常之间，可以允许评分卡模型中的因变量分为2种以上的类别。

评分卡的标准格式

标准评分卡采用下表所示格式

总分为账户每一个特征得分的简单相加。

除了为抽象的统计模型提供简明的表现形式之外，标准评分卡还有其他重要优势。这些优势包括：

容易理解
将每个变量的贡献加总得到一个总的信用分，这使得分值对于普通大众来说更加透明
比率(odds)，依据计算得到的比率，信用状况是正常或违约的概率与总的评分相关
评分卡简单容易实现
对每个变量分别赋予一定的分数，使得消费者清楚如何提高其信用评分

评分卡开发流程

下图概括了典型的评分卡开发流程

该流程的主要步骤包括：

问题准备
数据获取与整合
EDA与数据描述
数据准备
变量选择
模型开发
模型检验和评价
评分卡的创建和刻度
评分卡实施
监测和报告

问题准备

在此阶段，需要做出下列决策和解决下列问题

在特定的业务重点、财务结果和信贷产品历史表现的基础上，确定违约和正常的定义
确定计划的评分卡范围、开发和实施窗口
识别数据的范围和来源
设计主要项目管理计划，对时间、人员、资源等进行管理

数据获取与整合

包括取得计划的数据项并将其整合成适合进一步数据准备的形式。数据源一般分为内部数据和外部数据。

EDA与数据描述

探索性分析(EDA)和数据描述是检查数据并理解其特征的一系列的过程。在评分卡开发过程中，需要进行下列分析：

候选预测变量的单变量统计特征评价，及其在取值范围内的分布
计算每个候选变量的分类或分段下的违约概率
通过列联表、关联性和相关性指标确定不同变量间的检验关系

变量准备

数据准备在项目中最重要，一般占整个项目时间的80%以上。

数据准备的目的就是创建所谓的数据挖掘或建模视图，即包含开发评分卡模型的所有要素的唯一数据集。为了准备该视图，需要进行大量的数据清洗和转换工作，以创建具有较强预测力的预测指标。

变量选择

大多数信贷供应商都拥有丰富的数据，候选变量可能成千上万。处理如此大量数据的最好方法就是只选择那些表现出较强预测里的变量，以减少变量的数量。

模型开发

标准评分卡基于logistic回归模型。logistic回归的本质是线性回归的扩展，通过一个链接函数(link function)进行转换得到。经过转行，logistic回归的因变量变成二元变量(0/1)。

模型验证

通常，所有的预测模型都需要满足四项基本要求

必须达到可接受的准确水平
必须稳健，能适应更广发的数据
必须简单(奥卡姆剃刀原则)
必须有意义，即业务变量和预测值方面是可解释的

评分卡的创建和刻度

一个强有力的logistic回归模型建立并通过检验后，将被转换成标准评分卡的形式。

评分卡的实施

在IT系统和不同业务部门中实施评分卡模型之前，开发人员需要将评分卡转换成可实施的代码

拒绝演绎

拒绝演绎并不是评分卡开发过程中的标准步骤。评分卡开发使用的是已经审批并且经过一段时间运行的账户数据，已经表现出正常或违约的状态。因此，被拒绝申请的数据没有纳入评分卡开发过程中。拒绝演绎是尝试去分析可能会违约并在评分卡前已经被拒绝账户的一种方法。

监测和报告

和其他金融模型一样，评分卡的应用环境也是不断变化的。因此，还需要编制一系列的报告以监测其在预期的实施窗口内的表现。编制这些报告的主要目的如下：

判断评分卡的实际表现并与预期表现相比较
计算某些特定的指数，这些指数可用来重建评分卡等等
监测评分卡中使用客户群的特征变化