240 发简信
IP属地:广东
  • 120
    数据仓库

    1、数据仓库的目的及用途 数据仓库泛化、合并多维空间的数据。构造数据仓库涉及数据清理、数据集成、数据变换。 构造数据仓库的构成可以看做数据挖掘的一个重要预处理步骤。同时,数据...

  • python函数篇

    以下内容为阅读廖雪峰课程所做的课程笔记 1、调用函数 略 注:函数名其实就是指向一个函数对象的引用,完全可以把函数名赋给一个变量,相当于给这个函数起了一个“别名”: >>> ...

  • Python 字符编码

    1、什么是字符编码 【ASCII编码由来】计算机只能处理数字(采用8个比特(bit)作为一个字节(byte)),如果处理文本必须把文本转换为数字。美国人最早在设计计算机时,把...

  • 120
    Hive sql

    一、Hive介绍 Hive是Hadoop中的一个子项目,利用MapReduce技术,实现了部分SQL语句,提供了类SQL的编程接口。推进了Hadoop在数据仓库方面的发展。 ...

  • 120
    Hadoop基本原理

    1、Hadoop是什么 Hadoop是一个开源的分布式计算平台。 HDFS 和MapReduce是Hadoop的两大核心,整个Hadoop的体系结构主要是通过HDFS来实现对...

  • 【NO.1】KNN-算法

    KNN(K-nearest-neighbor)-K最近邻算法 1、算法简介 1)已知训练样本(分类); 2)对测试样本,基于某种距离度量找出训练样本中与其距离最近的K个样本;...