240 发简信
IP属地:北京
  • 机器学习第十课_svm算法

    支撑向量机,SVM(Support VectorMachine),其实就是一个线性分类器。在最初接到这个算法时,我们可能会一头雾水:这个名词好奇怪[问号脸],怎么“支持”?什...

  • 120
    机器学习第九课_主成分分析

    1、什么是主成分分析法 PCA(PrincipalComponent Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法(非监督的机器学习方法)。其最主要的...

  • 机器学习第八课_决策树

    2.1 学习的目标和本质 假设给定训练数据集,其中为输入实例(特征向量),n为特征个数,,,为类标记(label),,,,,N为样本容量 学习目标:根据给定的训练数据集构建一...

  • 机器学习第六课_其他几个重要概念

    1、偏差和方差 在机器学习中,过拟合和欠拟合都会使训练好的机器学习模型在真实的数据中出现错误。我们可以将错误分为偏差(Bias)和方差(Variance)两类。下面就来看看偏...

  • 机器学习第七课:逻辑回归

    逻辑回归(Logistic Regression,LR)。在Kaggle竞赛的统计中,LR算法以63.5%的出产率,荣获各领域中“出场率最高的算法”这一殊荣。在实际场景中,逻...

  • 机器学习第四课_线性回归

    我们所谓的建模过程,其实就是找到一个模型,最大程度的拟合我们的数据。在简单线回归问题中,模型就是我们的直线方程:y = ax + b 。 要想最大的拟合数据,本质上就是找到没...

  • 机器学习第五课_梯度下降法

    机器学习就是需找一种函数f(x)并进行优化, 且这种函数能够做预测、分类、生成等工作。 那么其实可以总结出关于“如何找到函数f(x)”的方法论。可以看作是机器学习的“三板斧”...

  • 120
    机器学习第三课_数据预处理2

    数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。 特征...

  • 机器学习第二课_数据预处理

    数值型特征分箱(数据离散化) 2.1 无监督分箱法 等距分箱 import pandas as pddf = pd.DataFrame([[22,1],[13,1],[33,...

  • 机器学习第二期_第一课_KNN算法

    1. kNN思想简介 鲁迅曾经说过:“想要了解一个人,就去看看他的朋友”。 kNN(k-NearestNeighbor),也就是k最近邻算法。顾名思义,所谓K最近邻,就是k个...

  • 疫情期间想脱单的伢子们

    亲们: 春节假期还剩一周的时间了,在北京漂着还单身的小伙伴们,疫情期间肯定都宅在家里,想脱单无人可聊,想工作也提不起心劲儿,2020年,让我们再努力一把,重塑积极的心态,敞开...

  • 120
    机器学习第四课:模型评估

    课程学习目标 数据拆分:训练数据集&测试数据集 评价分类结果:精准度、混淆矩阵、精准率、召回率、F1 Score、ROC曲线等 评价回归结果:MSE、RMSE、MAE、R S...

  • 120
    机器学习第三课_关于数据预处理和特征工程

    一、数据预处理:数值型特征无量纲化 1.数据标准化(Standardization) 标准化的前提是特征值服从正态分布,标准化后,其转换成标准正态分布。 优点: Z-Scor...

  • 机器学习第一课_KNN算法

    机器学习第一周小结 KNN算法原理: 在一个给定的类别已知的训练样本集中,已知样本集中每一个数据与所属分类的对应关系(标签)。 在输入不含有标签的新样本后,将新的数据的每个特...

  • 2019新年寄语

    今天是0210,从0128开始休假至今,感觉也是自己心路探索的一段历程,迷惘与追思,批判与妥协,挣扎与反抗,苦闷与探究。 今年,我就要30了。回首往事,诸多感慨,蓦然回首,那...

  • 晋升中遇到的问题

    预计可能的问题: 1、BI可视化平台对业务方的意义是什么? 工具或者效能的优势和意义:一方面集成了报表的功能,另一方面具有高可交互的、可视化的组件和功能,提供给业务方自助取数...

个人介绍
互联网行业资深数据分析师,后知后觉,探索灵魂和自我救赎