Lightgbm支持两种形式的调用接口:原生形式和sklearn接口的形式。 原生形式 sklearn接口的形式 导入包 2.加载boston房价数据 3.切分数据集 4.创...
1 分组聚合的原因 SQL中分组函数和聚合函数之前的文章已经介绍过,单说这两个函数有可能比较好理解,分组函数就是group by,聚合函数就是COUNT、MAX、MIN、AV...
HIVE是一个数据仓库,该仓库基于hadoop框架,可以将存在hdfs上的结构化数据文件映射为一张数据库表。HIVE可以使用类SQL语句来处理结构化数据(查询数据),也即是把...
窗口函数 窗口函数也称为OLAP(Online Analytical Processing)函数,意思是对数据库数据进行实时分析处理,窗口函数在Oracle和SQL Serv...
1 准备知识 HDFS:hadoop集群分布式文件系统,用来存储海量数据。HDFS采用分而治之的设计思想,将文件切分为文件块进行存储,存储数据的节点为datanode,存储这...
1 阿里云服务器选配 首先附上官网链接:阿里云官网[https://www.aliyun.com/] 点击上边链接,注册后登陆官网,选择产品选项,然后选择云服务器ECS,就进...
1 前言 在讲述Hadoop集群搭建之前,首先要了解Hadoop和集群两个名词,Hadoop是由Apache基金会开发的分布式系统基础架构,简单理解就是大数据技术应用的基础。...
1 前言 SQL进阶主要介绍谓词、CASE表达式、嵌套子查询、连接(以列为单位对表进行连接)和UNION运算(表为单位)。 SQL进阶在如下两个表web_city和city_...
1 前言 SQL函数主要介绍内建函数,其实跟Excel中的内建函数类似,后续Python中也是类似。有时候学习语言,真的没有那么难,都是相通的,难点在于如何去应用。这个没有捷...
1 前言 数据库(DB)是按照数据结构存储数据的仓库,数据库管理系统(DBMS)是操纵和管理数据库的一套软件,可分为关系型的数据库管理系统和非关系型的数据库管理系统。数据库管...
1 前言 Excel中图表大约有十多种,每种图表类型按照显示形式又可分为若干个子类型。如柱状图可以分为标准柱状图、堆积柱状图、和百分比堆积柱状图。Excel图表也是数据可视化...
1 引言 Excel是数据分析师的基础入门工具,在日常工作过程中,用好Excel函数可以节省很多时间,起到事半功倍的效果。 介绍函数之前,需要强调几个概念: 相对引用、绝对引...
Excel是数据分析人员的基础工具,Excel的功能也是非常强大,比如说制作报表、小工具开发、游戏制作,数据计算等等。所以说学好Excel,对自己的工作也是非常有帮助的。 认...