240 发简信
IP属地:安徽
  • NWR和Quorum机制

    分布式系统中的读写模型 分布式系统是由多个节点(指代一台服务器、存储设备等)构成,由于网络异常、宕机等节点并不能保证正常工作,特别是在节点数量很...

  • Resize,w 360,h 240
    Spark集群搭建

    Spark分布式集群搭建 Spark版本选择 三大主要版本: 本次选择的版本: Spark依赖环境 Spark分布式集群 Spark也是一个主从...

  • MySQL相关问题汇总(更新中)

    关于各种 DBMS 的介绍答疑 1文章中有句话不太理解,“列式数据库是将数据按照列存储到数据库中,这样做的好处是可以大量降低系统的 I/O”,可...

  • HBase集群的搭建

    HBase集群搭建 HBase官网:http://hbase.apache.org/[http://hbase.apache.org/]考虑点:...

  • Resize,w 360,h 240
    分布式NoSQL数据库HBase介绍

    1. HBase数据库介绍 HBase产生背景自1970年以来,关系数据库用于数据存储和维护有关问题的解决方案。大数据的出现后,好多公司实现处理...

  • Hive窗口函数row_number案例

    数据文件是:rownumbertest.txt,字段信息是:id,xb,age,name 用户信息表 数据结果展示: 需求:每种性别人群中,年龄...

  • Hive窗口分析函数

    1、概念 窗口分析函数:窗口函数也称为OLAP(OnlineAnalytical Processing)函数,是对一组值进行操作,不需要使用Gr...

  • PV点击率案例(Hive转化率)

    什么是浏览量(PV) 浏览量和访问次数是呼应的。用户访问网站时每打开一个页面,就记为1个PV。同一个页面被访问多次,浏览量也会累积。一个网站的浏...

  • Resize,w 360,h 240
    Hive内置函数总结

    1、相关帮助操作函数 2、学习内置函数的终极心法 3、测试内置函数的快捷方式 第一种方式:直接使用,不用from语法分支,例如: 第二种方式:创...

    1.1 1112 3 5 1