聚类算法是没用因变量的。聚类算法有层次聚类、基于划分的聚类、两步聚类法、基于密度的聚类。 聚类方法的逻辑 客户细分是将全体客户划分为多个分组并刻画特征的过程,使得组内客户高度...
Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplo...
回归分析是统计学的核心,通指那些用一个或多个预测变量(自变量)来预测相应变量(因变量)的方法OLS回归法又称普通最小二乘回归法,主要包括简单线性回归,多项式回归,多元线性回归...
在上一节中,我们学会了用lm()函数来拟合OLS回归模型,通过summary()函数来获取模型参数和相关统计量,但是没有任何输出告诉我们模型是否合适,所以我们要进行回归诊断 ...
双因素方差分析 在双因素方差分析中,受试者被分到两因子的交叉类别组中。示例数据来源于ToothGrowth数据集-随机分配60只豚鼠,分别采取两种喂食方式(橙汁或维生素C)各...
数据分析离不开数据可视化。我们最常用的就是pandas,matplotlib,pyecharts当然还有Tableau,看到一篇文章介绍plotly制图后我也跃跃欲试,查看了...
Plotly Express 是一个新的高级 Python 可视化库:它是 Plotly.py 的高级封装,它为复杂的图表提供了一个简单的语法。用 pip install p...
一.基本概念 "一张统计图形就是从数据到几何对象(geometric object, 缩写为geom, 包括点、线、条形等)的图形属性(aesthetic attribute...
一、cars包中的Salaries数据集 1.查看原数据结构 数据有重叠,调整透明度 修改为刻面图 暂时忽略性别和学术等级,做非参数光滑曲线loess,即默认值smooth ...
机器学习的步骤:先撸一个baseline的model出来,再进行后续的分析步骤,一步步提高,所谓后续步骤可能包括『分析model现在的状态(欠/过拟合),分析我们使用的fea...
聚类分析是一种无监督的学习方法,根据一定条件将相对同质的样本归到一个类总(俗话说人以类聚,物以群分)正式一点的:聚类是对点集进行考察并按照某种距离测度将他们聚成多个“簇”的过...
今天(2020-0430)逛twitter 时候看到一个唐大佬的帖子:do you really understand heatmaps? 中有一个链接提到了一篇文献 20...