似然函数 什么样的参数跟我们的数据组合后恰好是真实值。既什么样的参数的极值点 对数似然 似然是累乘,转换为对数似然,把乘法转换为加法(对数里的乘...
树模型 决策树:从根节点开始,一步步走到叶子节点(决策) 所有的数据最终都会落到叶子节点,既可以做分类也可以做回归image.png决策树对过滤...
通常输入的特征数据是高维的(大于3维),一般难以直接以原特征对聚类结果进行展示。而TSNE提供了一种有效的数据降维方式,让我们可以在2维或者3维...
K-Means算法是典型的基于距离的非层次聚类算法,在最小化误差函数的基础上将数据换分为预定的类数K,采用距离作为相似性的评价指标,即认为两个对...
在Python中,主成分分析的函数位于Scikit-Learn下:sklearn.decomposition.PCA(n_components ...
一些数据挖掘算法,要求数据是分类属性形式的。所以常常需要将连续属性变换成分类属性,即连续属性离散化。 常用的离散化方法 等宽法将属性的值域分成具...
数据规范化(归一化)处理是数据挖掘中的一项基础工作。消除指标间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例缩放,使之落入一个特...
Pandas DataFrame Selecting and Indexing image.png image.png image.png im...
Pandas Series创建/操作 Pandas Series创建 Pandas Series操作 Pandas Dataframe Data...