240 发简信
IP属地:上海
  • 120
    机器学习算法之:KNN

    KNN算法简介 首先介绍一下KNN算法的几个特点: KNN,全称K-Nearest Neighbor,中文名为K近邻 思想极度简单,最基础的分类算法,非常适合入门 应用数学知...

  • 120
    机器学习基础概念

    什么是机器学习 机器学习出现之前: 编写算法规则,输入计算机,机器执行后输出结果。 举个栗子:垃圾邮件分辨 编写规则定义什么是垃圾邮件,新邮件根据规则去判定是否为垃圾邮件。 ...

  • 120
  • 120
  • Hive函数

    Hive自定义函数注册 查询引擎都自带了一部分函数来帮助我们解决查询过程当中一些复杂的数据计算或者数据转换操作,但是有时候自带的函数功能不能满足业务的需要。这时候就需要我们自...

  • 120
    Hive的内部表/外部表/分区表/分桶表

    内部表:普通表,相当于mysql的物理表,对应hdfs数据,删除时同时删除元数据和hdfs表数据 外部表:关键字external,指向已存在的hdfs数据,删除时只删除元数据...

  • Hive知识总结

    Hive是一个构建在Hadoop之上的数据仓库软件,它可以使已经存储的数据结构化,它提供类似sql的查询语句HiveQL对数据进行分析处理。 Hive将HQL转换为MapRe...

  • 维度与指标

    维度与指标 指标与维度最基本的作用是描述与衡量,维度与指标往往成对出现,搭配使用。 无法衡量它,就无法增长它。维度一般选取非数值字段,举例如“性别”,“国家”,“产品类别”等...

个人介绍
不懂数据的前端不是好产品