为什么选择本书:
一直以来都想进入大数据和人工智能领域,但是总觉得没有真正入门,最近在研究金融科技的应用,了解到金融问题从本质上讲都是信用问题,同时也是将风险量化的系统能力。所以选择一本系统性介绍信用评分系统的书是一个比较好的开始
书籍信息:
作者:(美)托马斯王晓蕾
出版社: 中国金融
出版年: 2006-1
页数: 307
定价: 45.00元
装帧: 简裝本
ISBN: 9787504939302
总体印象:
书籍有比较明显的年代感,(2006年出版)由美国产业和应用数学协会编辑出版,是第一本系统介绍信用评分的理论著作本书从历史和哲学视角讨论信用评分的合理性,但是非常戏剧性的结果是一直没有完美的解决各种质疑,但是信用评分在信用卡方面的却是十分成功的。个人观点:通过大数据概率的统计结果预测某个具体的人的金融行为是不可能得到完美的合理性的。这涉及到人的自由意志问题,目前无解。概率论就像量子力学一样只有大样本事件才具备统计学意义,某一个孤立的事件都是随机的。
带着疑问读书:
1. 特征变量的选择过程
2. 信用评分对比评分卡的特性变量的差异分析
3. 算法模型如何选择
第一章:信用评分的历史和哲学基础
信用评分:不是一个人的固有属性,而是贷款人对借款人的主观评估,不同的贷款人对某个人的评分会不同,但长期来看会出现信用歧视产生。贷款人面对的第一个问题是通过“信用评分”技术判断是否给某借款人发放贷款。第二个问题是如何管理现有客户的信用额度管理,是由“行为评分”技术解决的。
历史:公元前2千多年前古巴比伦的石板记录了农民春耕时借款,秋收时连本带利还款的信用贷款行为。信用已经有5000年历史,而信用评分的历史只有50年(从2006年计算)。20世纪60年代信用卡和计算机的诞生使得信用评分成为可能,通过自动决策进行发卡有效的降低了50%的不良贷款率。1975年美国颁布了《公平信贷机会法》,该法案认为信贷的发放中存在的歧视是违法的,除非歧视是从“实证经验中推出来的,并在统计上是有效的”,改法律是为数不多的为律师以外的职业创造就业机会的法律,信用评分分析师就是这样的职业。信用评分也从判断违约可能性变为客户利润最大化上来。不仅如此,评分也关注客户的购买行为,用于进行商品推销行为。
哲学方法:不允许使用性别作为特征变量,因为这会导致性别歧视。(同样适用于种族、宗教,但还是有擦边球,例如使用姓名的首字母可能代表种族),有些没有被法律禁止的变量由于道德因素也没有被使用,例如:健康状况,不良记录,驾驶违规。不过对于失业来说却是一个很好的发放贷款的信用特征变量。主要质疑存在于,公平性(逐利目的),可靠性(无法解释)。
数据挖掘:其主要成功在于信用评分中的应用。其基础技术为数据汇总、变量剔除、分类观察、预测和解释。通过频率、平均值、方差、交叉表格进行总体观察,将客户已不同行为进行分组, 为每组制作不同的评分卡。信用评分只在统计学上有意义,对于具体的人的行为的相关性,而没有因果关系。