个人综合信用评分,是指通过使用科学严谨的分析方法,综合考察影响个人及其家庭的内在和外在的主客观环境,并对其履行各种经济承诺的能力进行全面的判断和评估。——百度百科
这几天呢,LZ分析了下庄博士的讲座。前面先是谈到了评级与评分的区别,以及为什么个人主要用评分而非评级去考量。
讲述完概念与标准之后,介绍了信用评分的起源。美国的FICO。
其次就是征信的分类。
上图指的是按照机构特点来划分。下面则是按照行为来分类。
一般而言,分有A卡B卡C卡三种,其中,A卡是指在用在申请阶段,叫申请评分,B卡就是指行为评分,基于客户借款和还款的行为情况分析得到的结果。C卡是指的催收评分。除此以外,还可以做基于营销的评分。也就是说你向一个客户发出这种业务上的邀请,他会不会响应。当然有的客户可能会结清或退出,也可以做挽留评分等。国外甚至会做一些破产的评分,因为国内关于个人破产的实际上并没有特这样的一个机制,所以,在咱们国内基本上很少去做这种破产的评分。
其次介绍到了我国征信评分的发展阶段。用图作为补充说明。目前拉卡拉、芝麻信用等属于我国第四代征信评分。
第一阶段,早期的金融机构如银行和保险用打分表的形式去评估。第二个阶段主要是试点征信机构做的这样的评分,这是较早基于征信数据的评分开发的一个尝试。第三个阶段是人民银行征信中心作为全国统一的金融信用信息数据库开发评分的这样一个情况。人行征信中心开发的评分就覆盖了几乎是所有的有信贷业务的人群,是真正意义上的全国性的个人信用评分。第四阶段市场化的这些征信机构,包括芝麻、拉卡拉甚至包括京东等等这类机构不断开发自己的评分体系。
当然,征信是否应该由人行来做,以及人行征信中心如何与市场化机构协调还是一个现实性问题。
再就是评分卡制度。在国内,目前有人认为是落后的,不过目前从实际操作中来讲,仍然是较为完善的一种方式,且国外仍在使用。
下面具体介绍下评分卡制度常用的模型。评分卡制度广泛用于信用风险评估和金融风险控制领域。
(1)原理
将模型变量通过证据权重进行编码,离散化之后再运用logistic回归模型进行的一种二分类变量的广义线性模型。
具体解释:首先,学过统计学的同学都知道logistic是一种常用模型。在征信评分中,常用的是二分类因变量的logistic模型。这个模型,你可以理解成一种公式,一种套路。用这种套路,你可以感受到你被学历、收入、资产负债比等等因素影响有多深。
(2)具体方法
在这种模型下,有两种常用方式,一种用英文统计学课本里叫dummy variables的东西去做编码,即虚拟变量。另外一种是WOE,也就是证据权重,即这个因素会对你有多少影响。
具体解释:虚拟变量,也就是化整为零。通过增加一个代表不同类别的变量比如0、1这样的阿拉伯数字来控制整个方程。这些数字是你的经纪人,也可以是你的原配,随时可以把你带跑偏了。而WOE证据权重,就是你被原来的经纪人影响有多深。当然,在评分里做模型,重要的是弄清因素与结果的关系,而不是明白剔除因素与构建模型中的方法。而且,在不同机构中,具体方法也不大一样。例如,FICO用的有向量积,而阿里则没有。
(3)拓展内容
有兴趣的孩纸们,可以点击这个给你们带来力量的网址~~
WOE 计算方法概述1 http://bbs.pinggu.org/thread-2142246-1-1.html
WOE计算方法概述2 http://blog.sina.com.cn/s/blog_8813a3ae0102uyo3.html
统计学原理课件(虚拟变量和多重共线性部分) http://doc.mbalib.com/view/dea9a3513979caddd867086273926efd.html