1.HIve是什么?
-由facebook开源,最初用于解决海量结构化的日志数据统计问题;2008年facebook把hive项目贡献给Apache;ETL(Extraction-Transformation-Loading)数据抽取、加载、处理工具;
-构建在Hadoop上的数据仓库框架,数据计算使用MapReduce,数据存储使用HDFS
-设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据
-Hive 定义了一种类 SQL 查询语言——HQL(类似SQL,但不完全相同)
通常用于进行离线数据处理(采用MapReduce);
可认为是一个HQL→MR的语言翻译器