剪枝是树类算法防止过拟合的重要方法,而且其思想非常有启发,可以在其他算法中参考使用。而且,(树的)过拟合本身就是重要的内容,所以单列出来。不过这...
冥思之时,总是想表达些什么东西;但当提起笔来,却觉得没什么想要表达。 今天想聊一下自我的认知。 古语有之:知人者智,自知者明。 八个字,很简单,...
一.简介 Kolmogorov-Smirnov是比较一个累计分布(cumulative distribution function)函数与经验分...
Mann-Kendall检验是一种非参数检验(无分布检验),其优点是不要求样本遵从一定的分布,也不受少数异常值的干扰。常用于对降水、径流、气温和...
一.背景 在 LOF 之前的异常检测算法大多是基于统计方法的,或者是借用了一些聚类算法用于异常点的识别(比如 ,DBSCAN,OPTICS)。这...
一.简介 所谓魔法函数(Magic Methods),是Python的一种高级语法,允许你在类中自定义函数(函数名格式一般为__xx__),并绑...
STL (Seasonal-Trend decomposition procedure based on Loess) 为时序分解中一种常见的算...
一.简介 一个好的距离衡量方法应该可以很好地表示数据之间的相似性,即距离近点的数据拥有更高的相似性。当数据以向量进行表示,每个维度的值代表不同属...
一.算法思想 局部加权回归(Lowess)的大致思路是:以一个点为中心,向前后截取一段长度为的数据,对于该段数据用权值函数做一个加权的线性回归,...