240 发简信
IP属地:北京
  • 240
    大数据数据仓库建设

    前言 互联网行业,除了数据量大之外,业务时效性要求也很高,甚至很多是要求实时的, 另外,互联网行业的业务变化非常快,不可能像传统行业一样,可以使用自顶向下的方法建立数据仓库,...

  • redis持久化机制RDB, AOF

    redis是一个内存数据库,数据保存在内存中,但是我们都知道内存的数据变化是很快的,也容易发生丢失。幸好Redis还为我们提供了持久化的机制,分别是RDB(Redis Dat...

  • Spark处理数据的速度为什么比Hive更快?

    考察:Spark和Hadoop运行机制的理解,对技术应用场景的敏感性和理解程度,这对工作的具体质量有很大的影响。 Spark SQL比Hadoop Hive快,是有一定条件的...

  • 240
    HDFS三大组件

    NameNode介绍: 职责:负责客户端请求(读写数据)的响应元数据的管理(查询,修改)配置副本存放策略管理集群数据块负载均衡问题 NameNode 元数据管理WAL(Wri...

  • 240
    mysql相关面试题

    一条SQL语句过来的流程是什么样的? 1.当客户端连接到MySQL服务器时,服务器对其进行认证。可以通过用户名与密码认证,也可以通过SSL证书进行认证。登录认证后,服务器还会...

  • 240
    Elasticsearch 基础

    一、ES基本概念 1.1 索引(Index) 一个索引就是一个拥有几分相似特征的文档的集合。一个索引由一个名字来标识(必须全部是小写字母),并且当我们要对这个索引中的文档进行...