pull 镜像 启动容器
pull 镜像 启动容器
索引原理 B - Tree 多路平衡查找树(每个节点最多m(m>=2)个孩子,成为 m 阶或者度) 叶子节点具有相同的深度 节点中的数据 key 从左到右是递增的image....
事务的概念 事务是数据库并发控制的基本单位 事务可以看作是一系列SQL语句的集合 事务必须要么全部成功,要么全部执行失败(回滚) 事务的四个基本特性 (ACID) 原子性(A...
测试表数据 user_login 表 该表表示,用户登录的日期 user_name 表 该表记录 id 和对应的姓名 over() 函数 所谓窗口函数,就是在sql 执行到...
Spark 通用问题 任务提交流程 用户创建Spark程序并提交 每个action会生成一个job,包含了一系列的RDD和对其如何进行操作的transformation 每个...
Hadoop 架构 Hadoop组成部分 HDFS管理者:namenode工作者:DataNode辅助管理者:secondaryNameNode MapReduce YARN...
Hadoop 的组成 HDFS管理者:namenode工作者:DataNode辅助管理者:secondaryNameNode MapReduce YARN管理者:Resour...
1.Python是一门面向对象的语言,在Python中一切皆对象 2.一个Python算法应该具有以下七个重要的特征: 1.有穷性(Finiteness):算法的有穷性是指算...
剑指 Offer 03. 数组中重复的数字[https://leetcode-cn.com/problems/shu-zu-zhong-zhong-fu-de-shu-zi-...
概念 RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本的数据处理模型。代码中是一个抽象类,它代表一个弹性的、...
Spark 核心模块 Spark Core : 提供了 Spark 最基础与最核心的功能,Spark 其他的功能如:Spark SQL,Spark Streaming,Gra...
前言 word count 相当于大数据领域的 Hello word,以此为入门案例需求: 输入字符串,最后侧输出每个字符串出现的次数 ,关于各种算子,后续会详细记录,本篇...
Flink 中的状态 算子状态 (Operator State) 键控状态 (Keded State) 状态后端 (State Nackends) 由一个任务维护,用来计算耨...
案例说明 输入数据为 “订单,课程,下单时间”,需求为找到下单每10秒内,每个课程的最早下单时间,watermark设置为 2秒 代码 env.setStreamTimeCh...
Flink 中的时间语义 Event Time : 事件创建的时间 Ingestion Time: 数据进入 Flink 的时间 Processing Time: 执行操作算...