庄传礼,博士,先后在安徽农业大学、中国人民银行征信中心、甘肃省酒泉市肃州区政府(挂职)等单位工作,目前在京东金融负责征信业务,一直从事信用体系建设、信用产品开发与应用等方面的研究和实践工作,开发了多款防范信用风险、欺诈风险相关的产品,主持开发了全国个人信用评分模型。
讲座主要内容:① 个人评分的作用与价值,②评述我国个人信用评分发展的4个阶段,③介绍评价个人信用评分模型的标准,④开发个人信用评分的主要流程,⑤个人信用评分开发过程中的几个关键问题。
前期有全文,后期自己会整理的哦~
1个人评分的作用与价值
1.1 信用评分的定义
我们简单聊下信用评分的概念。关于信用评分的概念,同上一次一样,有不同说法,我倾向于使用这个一个概念,这个概念就是,信用评分是指信用评估机构对主体信用信息进行量化,并以分值形式表达的这样一个过程或者是一个结果,这里面呢,强调有这样几点,一点是信用评估机构,我在上次讲征信的时候也提到过,我是把征信机构和评估机构分开的,虽然不拒绝征信机构做评分,但仍然希望征信机构能够专注于信用信息的真实、客观和权威,当然了,能够做到信息全面及时,那是更好的。而评级机构应该主要关注的是对被评价人来进行准确、合理、一致的评价,这几点都能体现公平在内。
这里有一张图,我是借鉴网上的,这个图是一个示意图,分了极好、优秀、良好、中等和较差。但是这并不是一个标准,有不少的人曾经问过我,说比如说像这样一个图上是不是说600分以上的人就可以给他放款呢?或者说有人说那个FICO分是680分,是不是就680分才应该是一个标准?我在后面关于评分应用或者说讲建模过程中会和大家详细聊一下,怎样划标准或者说怎样使用评分。分数可以简单的划一个分数线,然后分数线以上的接受,分数线以下拒绝,但是这是一个非常简单的一个应用,分数实际上有更大的作用,我在未来介绍评分的应用时会和大家聊聊这方面。第二个,这个概念里面信用信息这个词,我上次也提到了,我并不把这个信用信息就简单的鉴定为信贷信息,而是说与触犯法律法规违反标准及契约相关的信息或者与其相关联的信息,我认为都可以是信用信息,所以这里的信用信息是比较宽泛的。最后一点,评分指的是一个过程或者一个结果,因为评分这个词当然我们可以理解为是进行评分的这样一个工作,它指的是一个过程了,如果仅仅指的是分数这样一个结果,比如说680分或者650分,那这仅仅是一个结果。
1.2关于评分与评级概念的区分
关于评分和评级的对比。我个人认为,评分和评级,并没有本质性的差异。但是在技术和方法上可能有一些区别,上图,我对评分和评级进行了一个简单的对比,比如说评级主要采用AAA、BBB、CCC等这样或类似的,大概分为十级或者稍多一点的级,当然也有分更少的。而评分可能显然会比较多一些,比如我们常用的0到100分,甚至也有0到1000分的,也有300到850等,这个里面的级(分)就相对来讲会多一些。大家可以看到,我对评级和评分,基本上是基于这样一个划分,就是说,基于评价对象的重要性或者说对象的规模,一般而言如果是评价对象比较重要,或者它的规模比较大,对象数量尤其是对象数量比较少的时候,这个时候适合用评级的一个方式。当然相对应来讲,如果评价对象数量比较多,然后评价对象的重要性比较小的话,当然它的规模一般也都不会很大,在这种情况下比较适合于评分。
除了这种从规模数量上的划分之外,在有一些技术方法上可能也稍微有一些区别,比如说评级,大部分采用的是定性为主,加上一些定量分析。而评分,大多是因为评价对象比较多,基本上都是采用的构建统计模型,用模型来评价的方式。严格说关注的点也不完全一样,对评级来讲关键的点在于数据收集和分析,而评分的重点在于模型的建设。评级一般会采用规范的分析方法。规范的分析指的是一件事应该是什么样子。在评级的时候大家可以看到,对企业的评级,比如说某个行业,他的存货周转率应该是多少,被评企业与之对比,根据不同的情况进行分数的调整。而评分大部分采用的实证的方式。实证的方式主要是根据事情实际发生的情况进行分析。大家也可以看到,两者他们的成本是不一样的,对评级来讲。因为可能有更多的人的参与,那么一个规模比较大的评价对象,需要进行全面的数据采集和整理,成本还是比较高的,而如果仅用模型对方便收集到信息计算,那它的成本要低很多。
最后想说一点的就是,关于评级和评分的效果实际上关注的也不完全一样。评级可能更注重个体的准确性,而评分对于群体的准确性可能会更关注些。就是说,对于一个评级来讲,那么比较在意的是评级的结果,尤其是我们对一个企业进行评级,那么我们比较关注的是未来这个评级的结果表现的是不是和实际的情况是一致的;而评分可能更多的是对一个客群或者说一个群体的准确性。比如说我们在某一个分数段,他对应的违约率是比如说是1%,或者2%,那么在一百个这样的分数里边,最后实际发生的应该只是一个或者是两个出现违约的,具体的是对应的是哪一个个体呢,可能并不一定准确。
1.3评分选用原因
为什么要用评分,我觉得评分有这样几个方面的作用,分别是更准确、更一致、更客观、更便捷和成本更低。更准确这样一个说法,主要是因为在构建模型的过程中,会采用数百万甚至上千万的样本进行学习训练,得到的分析结果与实际相对会比较吻合。一般使用评分,除了评价结果更准确的原因之外,还会考虑到客观的因素,一般采用模型评分会比信贷员或者调查员的面对面评价更客观,因为可以避免评价人的主观性或者受情绪各方面的影响。而基于模型的方式,虽然在建模过程中会有建模人的主观因素在,但相对来讲会少很多。更一致这样一个概念,可能有些人不太会会提,评分的一致性实际上是评分能够发挥更大作用的关键,我在后面会专门讲。
评分呢不像信用报告有那么多的数据,它只有一个表示信用方面的分值,所以他更容易嵌入到这个自动化的系统里面配合各种各样的策略,使用起来会更便捷一些。刚才我也提到了对个人的食用评分主要基于评分模型对个人进行评分,在这个建模过程中的会花些精力和一些成本,但后期的使用呢会使成本降得很低。
1.4 FICO评分
专门给大家介绍一下FICO评分。因为FICO评分现在也是注册的商标。FICO这家机构原来叫费艾哲,它是由美国二十世纪五十年代时候的两个专家(一个是工程师另外一个是数学家)成立的,他们使用LOGISTIC回归做了一个信用评分的模型,早期并不是给银行使用的,而是给百货商场的消费信贷使用的,但是在百货公司并没有得到广泛的应用。后来在银行业尤其是信用卡领域得到了很好的应用。目前来讲,FICO的方法应该说是得到全球公认的一种技术,尤其是美国三大征信局,他们的信用报告上签的都是这个FICO信用分,而不是他们自己的分,因此FICO也基本上成了一个个人信用评分的这样一个代名词。
1.5个人信用评分分类方法
个人信用评分有很多种分类方法。我先在在这里给大家介绍两种。一种是基于机构的特点。说是基于机构的特点,我个人认为,主要是基于数据的特点。在图的左边这样有三个划分,分别叫做征信局评分、行业共享评分和内部评分。我们先从内部评分来说,内部评分实际上主要指的是评价机构比如说商业银行他们基于自己收集到的数据,主要是基于自己客户数据构建模型,当然也可能会用到征信局的数据,这个模型的特点主要对于某个具体的业务或者说某个客群是比较有效的。行业共享评分主要是指一个行业的几家机构使用他们共同的数据,也包括会从征信局拿到的一些数据构建的模型,这个模型基本上是对他们有共同行为特征的客户或者是相同或相近的业务来使用。征信局的评分一般主要指征信机构利用他所采集到的丰富信息对个人进行这样一个综合的信用评价。因为征信局收集的信用信息的维度也比较广,覆盖的人群也会比较多。所以征信局的评分做起来也会比较复杂,那么它的评价相对来讲是要比较综合全面一些。
在国外,征信局评分也叫Bureau score,在国内,原来我在写文章或者对外讲的时候,早期的时候我也是用的征信局评分这个称呼,或者说是局评分。但后来也有人跟我说,不要用征信局评分,也不要用局评分,因为我们有一个征信管理局,所以很容易让大家误解是征信管理局做的评分。所以后来我基本上在对外介绍或者写文章的时候基本上都是征信机构评分这样一个说法。
右侧这个图好象也是借的。但是这个图呢应该是我在08、09年在跟商业银行介绍这个评分分类方式的时候用的。这个主要是根据信贷的生命周期不同阶段来划分的评分。比如我刚才也说到的模型的有A卡B卡C卡,A卡是指在用在申请阶段,叫申请评分,B卡就是指行为评分,基于客户借款和还款的行为情况分析得到的结果。C卡是指的催收评分。但除了A、B、C之外我们还可以做更多评分,比如说基于营销的可以做响应的评分。也就是说你向一个客户发出这种业务上的邀请,他会不会响应。当然有的客户可能会结清或退出,也可以做挽留评分等。国外甚至会做一些破产的评分,因为国内关于个人破产的实际上并没有特这样的一个机制,所以,在咱们国内基本上很少去做这种破产的评分。