1 概念 归一化:1)把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快...
1 概念 归一化:1)把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快...
本文介绍Kaggle平台上Zillow房价预测比赛的解决方案,主要是介绍特征工程(Feature Enginering)和模型融合(Model ...
类别较多的时候,独热编码性能不好,可能会造成类数的爆炸,可以预先进行粗分,再接着往下分类。独热编码的矩阵是稀疏矩阵。 可能有的疑问解答: One...
获取最优化算法的一种方法,是解决无约束优化问题,用递归来逼近最小偏差的模型。关于梯度的概念大家可参见以前的文章:从方向导数到梯度 梯度下降法迭代...
前言:以下是我在自己理解的基础上做的总结,介绍了机器学习的定义以及评估算法的几个概念。 定义 机器学习是一门从数据中研究算法的科学学科。是根据已...
以下内容属于经验总结的建模模块,建模模块目前包括 lasso 和 XGBoost,文章内容属于 XGBoost。 建模 XGBoost 功能介绍...
xgboost 已然火爆机器学习圈,相信不少朋友都使用过。要想彻底掌握xgboost,就必须搞懂其内部的模型原理。这样才能将各个参数对应到模型内...
一:前言 利用上次爬取的朝阳区房价数据,通过简单线性回归模型、决策树回归模型、xgboost回归模型来进行房价预测效果对比,期间遇到一些问题和解...
一:前言 这是一个线性回归的学习笔记,数据源是我爱我家的北京朝阳区的房屋价格及其相关信息,有室、厅、大小、朝向、楼层层数、装修程度、单价、总价。...
一: 前言 这次是利用的keras 2.08 版本配合tensorflow 1.2 + GPU 进行的CNN 猫狗二分类识别训练(根据相关dem...
专题公告
机器学习