240 发简信
IP属地:青海
  • 主流的大数据框架有哪些

    目前,主流的大数据框架主要包括Hadoop、Spark、Flink、Kafka和Storm等。这些框架各有特点和适用场景: Hadoop: 简介:Hadoop是一个开源的分布...

  • 《数据流式开发》课程体系

    1.基础课程 数学基础:线性代数、概率论与数理统计、微积分 计算机科学基础:数据结构与算法、计算机组成原理、操作系统基础 2.编程技能 编程语言:Java、Python、Sc...

  • 《数据离线开发》课程体系

    1.基础课程 数学基础:线性代数、概率论与数理统计、微积分 计算机科学基础:数据结构与算法、计算机组成原理、操作系统基础 2.编程技能 编程语言:Java、Python、SQ...

  • 《数据售前和解决方案》课程体系

    1.基础课程 计算机科学基础:数据结构与算法、操作系统基础、计算机网络 编程技能:Python、Java、SQL 2.业务理解 行业知识:不同行业的业务流程和特点 业务分析:...

  • 《数据架构师》课程体系

    1.基础课程 数学基础:线性代数、概率论与数理统计、微积分 计算机科学基础:数据结构与算法、计算机组成原理、操作系统基础 2.编程技能 编程语言:Java、Python、Sc...

  • 《数据挖掘》课程体系

    1.基础课程 数学基础:高等数学、线性代数、概率论与数理统计 计算机科学基础:数据结构与算法、计算机组成原理、操作系统基础 2.编程技能 编程语言:Python、Java、R...

  • 《数据分析工程师》课程体系

    1.基础课程 数学基础:线性代数、概率论与数理统计、微积分 计算机科学基础:数据结构与算法、计算机组成原理、操作系统基础 2.编程技能 编程语言:Python、R 数据库技术...

  • 《数据平台开发工程师》课程体系

    1.基础课程 数学基础:线性代数、概率论与数理统计、微积分 计算机科学基础:数据结构与算法、计算机组成原理、操作系统、计算机网络 2.编程技能 编程语言:Java、Pytho...

  • 《数据研发工程师》课程体系

    1.基础课程 数学基础:线性代数、概率论与数理统计、微积分 计算机科学基础:数据结构与算法、计算机组成原理、操作系统、计算机网络 2.编程技能 编程语言:Python、Jav...

  • 《数据开发工程师》课程体系

    基础课程: 数学基础:高等数学、线性代数、概率论与数理统计 计算机科学基础:数据结构、计算机原理、操作系统原理、计算机网络原理 编程技能: 编程语言:C++程序设计、Pyth...

  • 120
    Hive:拉链表

    拉链表(Slowly Changing Dimension, SCD)是数据仓库中处理缓慢变化维(Slowly Changing Dimension)的一种技术。在现实世界中...

  • 120
    Hive:分区分桶

    在Hive中,分区(Partitioning)和分桶(Bucketing)是两种重要的数据组织方式,它们可以显著提高查询性能,尤其是在处理大规模数据集时。 ### 分区(Pa...

  • 120
    Hive:数据类型

    Hive支持多种数据类型,可以分为以下几个主要类别: 1. **原始数据类型**: - **数值类型**: - `TINYINT`:1字节整数 - `SMAL...

  • 120
    Hive:HQL

    HiveQL是Hive的查询语言,它类似于SQL(Structured Query Language),用于在Hive数据仓库中进行数据查询、数据操作和数据定义。HiveQL...

  • 120
    HDFS:DataNode

    HDFS(Hadoop Distributed File System)的DataNode是HDFS集群中负责存储数据的节点。DataNode的设计目的是高效地存储大量数据,...

  • 120
    HDFS:NameNode

    HDFS(Hadoop Distributed File System)的NameNode是HDFS架构中的一个关键组件,它负责管理文件系统的命名空间和控制对文件的访问。以下...

  • 120
    HDFS:读写流程

    HDFS(Hadoop Distributed File System)的读写流程是为了高效地处理大规模数据集而设计的。以下是HDFS中数据读写的基本流程: ### 写数据流...

  • 120
    HDFS:Block块存储

    在HDFS(Hadoop Distributed File System)中,Block(块)是数据存储的基本单元。HDFS使用Block的概念来在多个DataNode上分布...

  • 120
    HDFS:架构

    HDFS(Hadoop Distributed File System)是一个分布式文件系统,专为大规模数据处理而设计。HDFS的架构设计允许它在商用硬件上运行,并提供高吞吐...

  • 120
    Hive:元数据

    Hive的元数据是Hive架构中非常关键的一部分,它记录了Hive表结构、分区、桶以及其他数据仓库的元信息。以下是Hive元数据的一些核心概念和组成部分: 1. **Hive...