数仓总结目录:说说数仓(1) - 什么是数仓说说数仓(2) - 传统数仓与互联网数仓说说数仓(3) - 数仓架构说说数仓(4) - 指标字典说说数仓(5)-最重要的维度之日期...

IP属地:浙江
数仓总结目录:说说数仓(1) - 什么是数仓说说数仓(2) - 传统数仓与互联网数仓说说数仓(3) - 数仓架构说说数仓(4) - 指标字典说说数仓(5)-最重要的维度之日期...
导读:pyecharts是一款将python与echarts结合的强大的数据可视化工具,本文将为你阐述pyecharts的使用细则。 前言 我们都知道python上的一款可视...
手肘法 - 核心指标:SSE(sum of the squared errors,误差平方和) Ci是第i个簇 p是Ci中的样本点 mi是Ci的质心(Ci中所有样本的均值) ...
当我们说到p-value时,我们在说什么? “这个变量的p-value小于0.05,所以这个变量很重要” ........ 你真的知道自己在说什么么???这个p-value到...
AUC是一种衡量机器学习模型分类性能的重要且非常常用的指标,其只能用于二分类的情况.AUC的本质含义反映的是对于任意一对正负例样本,模型将正样本预测为正例的可能性 大于 将负...
前言:下面介绍另外一种集成算法思想—boosting,提升学习(Boosting)是一种机器学习技术,可以用于回归和分类的问题,它 每一步产生弱预测模型(如决策树),并加权累...
特征选择与特征学习 在机器学习的具体实践任务中,选择一组具有代表性的特征用于构建模型是非常重要的问题。特征选择通常选择与类别相关性强、且特征彼此间相关性弱的特征子集,具体特征...
时不时的用到随机数,主要是自带的random和numpy的random,每次都靠猜,整理一下 random python自带random模块,用于生成随机数 random.r...