时间序列是指一组在连续时间上测得的数据,其在数学上的定义是一组向量x(t), t=0,1,2,3,...,其中t表示数据所在的时间点,x(t)是一组按时间顺序(测得)排列的随...
时间序列是指一组在连续时间上测得的数据,其在数学上的定义是一组向量x(t), t=0,1,2,3,...,其中t表示数据所在的时间点,x(t)是一组按时间顺序(测得)排列的随...
像个设计师一样,设计出高颜值的 PPT,是职场人努力追求的目标之一,大家都希望不费吹灰之力,但能收获拔群的效果。 《写给大家看的设计书》一书中,提到了设计四原则:对比、对齐、...
xgboost是时下热门的机器学习算法,在面试和竞赛中出现的频率非常高,但网上却没有一篇能够完全讲清楚的文章,因此,本文旨在用尽量少的公式,将xgboost讲清楚,明白,透彻...
xgboost 已然火爆机器学习圈,相信不少朋友都使用过。要想彻底掌握xgboost,就必须搞懂其内部的模型原理。这样才能将各个参数对应到模型内部,进而理解参数的含义,根据需...
多类逻辑回归 (Multinomial Logistic Regression) 基本概念解释与数学背景知识 回归分析(regression analysis) 在统计学中,...
在现实生活中很多机器学习问题有上千维,甚至上万维特征,这不仅影响了训练速度,通常还很难找到比较好的解。这样的问题成为维数灾难(curse of dimensionality)...
干净整洁的数据是后续进行研究和分析的基础。数据科学家们会花费大量的时间来清理数据集,毫不夸张地说,数据清洗会占据他们80%的工作时间,而真正用来分析数据的时间只占到20%左右...
一、关于sklearn fit 和transform sklearn里的封装好的各种算法使用前都要fit; fit之后,可以调用各种API方法,transform是其中一个A...
今天我们来讨论机器学习中一个非常重要的函数GridSearchCV,它是我们用来求解最佳参数组合的常用函数。例如:我们的随机森林算法有很多参数,如n_estimators,m...
1 重要参数说明 DecisionTreeClassifier和DecisionTreeClassifier 重要参数调参注意点参考网址:https://blog.csdn....
时间序列简介 时间序列是时间间隔不变的情况下收集的时间点集合,没有其他数据辅助。这些集合被分析用来了解长期发展趋势,为了预测未来或者表现分析的其他形式。 最近完成一个基于时间...
7 种交叉验证方法 在任何有监督机器学习项目的模型构建阶段,我们训练模型的目的是从标记的示例中学习所有权重和偏差的最佳值。 如果我们使用相同的标记示例来测试我们的模型,那么这...
1.模型的评估与参数调优 1.1交叉验证/Cross - validation 1.1.1 K折交叉验证 1.1.2 sklearn中的交叉验证 1.1.3不同的数据切分方式...
不可否认的是,现在在做深度学习的过程中,调参数是一件非常重要且主要的事情。那么,今天我们来讲一下调参数这件事。 Grid Search Grid Search就是穷举,穷举所...
<font color=blue> 岭回归 岭回归和lasso解决回归中重大疑难问题:排除多重共线性,进行变量的选择 最小二乘估计 在给定经典线性回归的假设下,最小二乘估计量...
正则化是一个通用的算法和思想,所有会产生过拟合现象的算法都可以使用正则化来避免过拟合。在经验风险最小化的基础上(也就是训练误差最小化),尽可能采用简单的模型,可以有效提高泛化...
在用机器学习算法对数据进行拟合的过程中,往往一开始得不到满意的结果,例如 AUC 值不够高,此时我们就需要对模型进行调优,那么调优的方向是什么?有没有调优方法论可遵循?答案当...
功能强大的python包(一):Numpy 1.Numpy简介 Numpy是python的一种开源的数值计算扩展;Numpy可用来存储和处理大型矩阵;Numpy支持大量的维度...