240 发简信
IP属地:甘肃
  • 逻辑回归的本质及其损失函数

    逻辑回归为什么要使用sigmoid函数作为假设? 为了实现非线性化。 因为线性回归模型的预测值为实数,而样本的类标记为(0,1),我们需要将分类任务的真实标记y与线性回归模型...

  • 线性回归

    简单线性回归:(只有一个特征)通过最小二乘法找到一个拟合函数,使样本点到拟合直线的距离最短。 多元线性回归:(有多个特征)梯度下降寻找最优拟合曲线。

  • 数据预处理

    参考资料:https://mp.weixin.qq.com/s/x00bAoFg2LUa2kihIZo_HA 总结的太好了!! 1.无量纲化:最值归一化、均值方差归一化及sk...

  • 120
    模型效果评价

    目录: 数据拆分:训练数据集&测试数据集 分类模型评价指标:精准度、混淆矩阵、精准率、召回率、F1 Score、ROC曲线等 回归模型评价指标:MSE、RMS...

  • 120
    线性回归

    线性回归参考资料https://mp.weixin.qq.com/s/siFRKWLhGOGJCCMjzB7R7A 最小二乘法算线性回归的原理:所有的样本点到拟合最好的直线y...

  • 120
    机器学习面试之KNN

    KNN(K-NearestNeighbor)K近邻算法,无模型训练过程,样本即判断标准。 题目:以下哪个图是KNN算法的训练边界(A) KNN算法肯定不是线性的边界, ...

  • Mysql索引

    Mysql索引的建立对于Mysql的高效运行是很重要的,索引可以大大提高Mysql的检索速度索引分为单列索引和组合索引。单列索引,即一个索引只包含单个列,一个表可以有多个单列...

  • Hive Join详解

    Join原理 Hive执行引擎会将HQL“翻译”成为MapReduce任务,如果多张表使用同一列做Join,将被“翻译”成一个MapReduce任务,否则会被“翻译”成多个M...

  • 120
    2019-07-11代码逻辑正确并执行成功,但查询数据出错

    今日份bug is_fans字段在dt=20190709分区下的数据有问题。脚本显示执行成功,但是查询数据错误,表现:is_fans字段全为0(理应有0有1) 原因:上...

  • 120
    Hive原理及SQL优化

    1.Hive原理 Hive是构建在Hadoop上的数据仓库软件框架,支持使用SQL来读,写和管理大规模数据集合。Hive入门非常简单,功能非常强大,所以非常流行。 通常来说,...