简介 由于计算机存储的规则所致,有些时候浮点数存入和读取出来的值并不相等,同样的数据用单精度(float)和用双精度(double)存储,获取出来的值也会有差异。所以,当我们...
简介 由于计算机存储的规则所致,有些时候浮点数存入和读取出来的值并不相等,同样的数据用单精度(float)和用双精度(double)存储,获取出来的值也会有差异。所以,当我们...
新岁,王自青归,奉上令同张为某司之急务。组会报近日所成,上赞之。张甚不平,忿然曰:此数日吾为之多,汝所为甚少。浅言划水者获誉,勠力劳苦者无闻,何也? 对曰:上言某过,非真某之...
一、数据仓库概念 数据仓库(Data Warehouse)简称DW或DWH,是数据库的一种概念上的升级,可以说是为满足新需求设计的一种新数据库,而这个数据库是需容纳更多的数据...
1. 什么是Hadoop 大数据处理的分布式系统 2. Hadoop****生态圈 三大核心: HDFS集群:分布式文件存储系统 YARN集群:运算资源调度 MapReduc...
1. Kafka Kafka 是一种高吞吐量、分布式、基于发布/订阅的消息系统,最初由 LinkedIn 公司开发,使用 Scala语言编写,目前是Apache的开源项目。 ...
基础hash元素 核心属性分析 构造方法 求Hash值 put() putVal() resize() 重点! get() getNode() remove() repal...
一、接口继承关系和实现 集合类存放于Java.util包中,主要有3种:set(集)、list(列表包含Queue)和map(映射)。1. Collection:Collec...
1. HDFS: HDFS:Hadoop Distributed File System Hadoop 分布式文件系统 优点: 存储海量数据:HDFS可横向扩展,其存储的文件...
一、几种IO模型 1.阻塞IO模型(我就死等) 最传统的一种IO模型,即在读写数据过程中会发生阻塞现象。 当用户线程发出IO请求之后,内核会去查看数据是否就绪,如果没有就绪就...
NoSQL介绍和redis介绍 not only SQL:非关系型数据库; 作用:应用于海量数据用户数据的前提下的数据处理问题。特征:可扩容;可伸缩;大数据量下高性能;灵活的...
1.什么是Spark?Spark 大规模数据处理的快速通用的计算引擎。Spark来源于Hadoop MapReduce,同时Job中间输出结果可以保存在内存中,从而不再需要读...
本文仅作为笔者学习记录之用,侵删原文:https://www.cnblogs.com/CodeBear/p/10911177.html 缓存穿透 我们经常会把一部分数据放在R...
原文:https://mp.weixin.qq.com/s/gAwe56D3a5uNJYvxKC1t-Q 概述 在官方文档中是这样描述HashMap的: 基于Map接口实现、...
原文:https://www.cnblogs.com/xdecode/p/9321848.html 最近在整理数据结构方面的知识, 系统化看了下Java中常用数据结构, 突发...
Shuffle简介 Shuffle的本意是洗牌、混洗的意思,把一组有规则的数据尽量打乱成无规则的数据。而在MapReduce中,Shuffle更像是洗牌的逆过程,指的是将ma...
作为互联网从业人员,目前看来对数据指标、指标的运用还是需要再深入学习下。 一、常见指标 先来看一看常见的一些数据指标们 1、DAU:Daily Active User 日活跃...
本文仅为笔者平日学习记录之用,侵删原文:https://mp.weixin.qq.com/s/gPx6q1pZRAuQuJslLER4Mg Flink任务常见的提交方式通过f...
本文仅为笔者平日学习记录之用,侵删原文:https://mp.weixin.qq.com/s/MWBoBPVhiB4VgpchtR6_nQ 在Flink1.10任务提交流程分...
本文仅为笔者平日学习记录之用,侵删原文:https://mp.weixin.qq.com/s/TUFNictt8XXLmmyWlfnj4g 让分布式系统的操作变得简单,在某种...
原文:https://mp.weixin.qq.com/s/mwCfqjhgqU98LR315GZTpg 前言 Redis是目前最火爆的内存数据库之一,通过在内存中读写数据,...