前言 1.1 赛题背景本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 —— 零基础入门金融风控-贷款违约预测。 赛题以金融风控中的个人信贷为背景,要求...
解决的问题是预测预测用户贷款是否违约为任务。提交的形式应该是一个二分类形式(2个字段,一个是id,一个是违约的可能性),目前提交第一名结果是0.749。该结果是竞赛采用AUC...
背景介绍: 公共自行车低碳、环保、健康,并且解决了交通中“最后一公里”的痛点,在全国各个城市越来越受欢迎。本练习赛的数据取自于两个城市某街道上的几处公共自行车停车桩。我们希望...
背景介绍: 公共自行车低碳、环保、健康,并且解决了交通中“最后一公里”的痛点,在全国各个城市越来越受欢迎。本练习赛的数据取自于两个城市某街道上的几处公共自行车停车桩。我们希望...
解决的问题是预测两个城市某街道上的几处公共自行车停车桩。我们希望根据时间、天气等信息,预测出该街区在一小时内的被借取的公共自行车的数量。数据下载地址:http://sofas...
关于比赛的基本操作描述,参考简书[https://www.jianshu.com/p/6066bf12be98]。学习了比赛中排行第三(rank3)的源码kernal,参考链...
我是神医:
1."利用特征Age提取新特征AgeBand,目的是根据AgeBand的区间重新赋予Age处理值"这一步骤中,赋值时最后一行代码“dataset.loc[ dataset['Age'] > 64, 'Age']”只是一个条件筛选,没有进行任何赋值或操作,应该改写为“dataset.loc[ dataset['Age'] > 64, 'Age'] = 4 # 将年龄大于 64 的乘客划分为第 5 组”
2.数据清洗结束后,数据集中存在非数值型(字符串类型)的特征列“Title”,简单的,可以在跑模型之前进行独热编码,“X_train = pd.get_dummies(X_train)“、”X_test = pd.get_dummies(X_test)”。
kaggle——泰坦尼克之灾2关于比赛的基本操作描述,参考简书[https://www.jianshu.com/p/6066bf12be98]。学习了比赛中排行第三(rank3)的源码kernal,参考链...
andyham[https://www.jianshu.com/u/50a582498997] kaggle——泰坦尼克之灾1[https://www.jianshu.co...
标题 一级标题 二级标题 三级标题 四级标题 五级标题 六级标题 列表无序列表 文本1 文本2 文本3 有序列表 文本1 文本2 文本3 插入链接,使用 显示文本[%E9%9...
泰坦尼克之灾是kaggle的一个入门案例,以下是这个比赛的一些记录: 1、jupyter notebook的安装 相比之前使用的pycharm,jupyter noteboo...