项目目的:本文通过对kaggle上的Give Me Some Credit数据的挖掘分析,结合信用评分卡的建立原理,从数据的预处理、变量选择、建模分析到创建信用评分,创建了一...
项目目的:本文通过对kaggle上的Give Me Some Credit数据的挖掘分析,结合信用评分卡的建立原理,从数据的预处理、变量选择、建模分析到创建信用评分,创建了一...
上一篇 4、模型训练 a、WOE值替换 在上一篇文章我们已经获取了每个变量值的分箱数据和woe值,现在我们用woe值替换各变量数据的分箱号,也就是原来的分箱数据是表示各个数值...
本文采用lending club官网公开数据中2017年Q2部分,数据内容为贷款申请人信息包括申请人的年龄、性别、婚姻状况、学历、贷款金额、申请人财产情况等(自变量)和贷款履...
本文转载自公众号:大数据风控与机器学习 一、简介 所谓信贷评分卡指的是,将违约概率映射成得分的模型。最传统、应用最广泛的算法是逻辑回归。但是理论上,所有能输出概率的模型均可以...
拖了好久忘记了我的评分卡模型的拟写。这一次稍微好好写一下。本文章主要是写一下评分卡建模的主要流程 一、建模思路 二、数据集介绍 givemesomecredit --Kagg...
前情提要 通俗地说决策树算法(一)基础概念介绍 通俗地说决策树算法(二)实例解析 上面两篇介绍了那么多决策树的知识,现在也是时候来实践一下了。Python有一个著名的机器学习...
出门旅行,订酒店是必不可少的一个环节。住得干净、舒心对于每个出门在外的人来说都非常重要。 在线预订酒店让这件事更加方便。当用户在马蜂窝打开一家选中的酒店时,不同供应商提供的预...
关联分析用于发现用户购买不同的商品之间存在关联和相关联系,比如A商品和B商品存在很强的相关性,常用于实体商店或在线电商的推荐系统,例如某一客户购买A商品,那么他很有可能会购买...
实验目的 学习如何读取一个文件 学习如何使用DataFrame 学习jieba中文分词组件及停用词处理原理 了解Jupyter Notebook 概念 中文分词 在自然语言处...