240 发简信
IP属地:北京
  • 线性回归

    似然函数 什么样的参数跟我们的数据组合后恰好是真实值。既什么样的参数的极值点 对数似然 似然是累乘,转换为对数似然,把乘法转换为加法(对数里的乘...

  • Resize,w 360,h 240
    决策树算法概述

    树模型 决策树:从根节点开始,一步步走到叶子节点(决策) 所有的数据最终都会落到叶子节点,既可以做分类也可以做回归image.png决策树对过滤...

  • Resize,w 360,h 240
    5.2.4 聚类可是化工具-TSNE

    通常输入的特征数据是高维的(大于3维),一般难以直接以原特征对聚类结果进行展示。而TSNE提供了一种有效的数据降维方式,让我们可以在2维或者3维...

  • Resize,w 360,h 240
    5.2.2 K-Mean聚类算法

    K-Means算法是典型的基于距离的非层次聚类算法,在最小化误差函数的基础上将数据换分为预定的类数K,采用距离作为相似性的评价指标,即认为两个对...

  • 4.4 主成分分析

    在Python中,主成分分析的函数位于Scikit-Learn下:sklearn.decomposition.PCA(n_components ...

  • Resize,w 360,h 240
    4.3.3 连续属性离散化

    一些数据挖掘算法,要求数据是分类属性形式的。所以常常需要将连续属性变换成分类属性,即连续属性离散化。 常用的离散化方法 等宽法将属性的值域分成具...

  • 4.3.2 数据规范化

    数据规范化(归一化)处理是数据挖掘中的一项基础工作。消除指标间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例缩放,使之落入一个特...

  • Resize,w 360,h 240
    Series/DataFrame Selecting/Indexing/Reindexing/多级index

    Pandas DataFrame Selecting and Indexing image.png image.png image.png im...

  • Resize,w 360,h 240
    Pandas Series/DataFrame创建/操作/理解

    Pandas Series创建/操作 Pandas Series创建 Pandas Series操作 Pandas Dataframe Data...