1、优点
(1)操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)
(2)避免了去写MapReduce,减少开发人员的学习成本。
(3)Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数。
(4)可扩展性,横向扩展,Hive 可以自由的扩展集群的规模,一般情况下不需要重启服务 横向扩展:通过分担压力的方式扩展集群的规模 纵向扩展:一台服务器cpu i7-6700k 4核心8线程,8核心16线程,内存64G => 128G
(5)延展性,Hive 支持自定义函数,用户可以根据自己的需求来实现自己的函数
(6)良好的容错性,可以保障即使有节点出现问题,SQL 语句仍可完成执行
2、缺点
(1)Hive 不支持记录级别的增删改操作,但是用户可以通过查询生成新表或者将查询结 果导入到文件中(当前选择的 hive-2.3.2 的版本支持记录级别的插入操作)
(2)Hive优势在于处理大数据,对于处理小数据没有优势,因为Hive的执行延迟比较高,因为 MapReduce Job 的启动过程消耗很长时间,所以不能 用在交互查询系统中,因此hive常用于数据分析,对实时性要求不高的场合
(3)Hive 不支持事务(因为不没有增删改,所以主要用来做 OLAP(联机分析处理),而 不是 OLTP(联机事务处理),这就是数据处理的两大级别)。