官方网站链接:http://hive.apache.org/
简介
Hive是建立在Hadoop之上的数据仓库,提供类似于SQL的HQL语言,封装了底层的MapReduce过程,有SQL基础的业务人员,也可以直接利用Hadoop进行大数据的操作。
应用场景
建立在Hadoop之上的数据仓库,提供类似于SQL的查询语言,用户可通过此工具对Hadoop体系中的数据进行查询分析。
功能特性
1. 支持节点在线水平扩展
Hive支持集群规模在线水平扩展。
2. 容错性
良好的容错性,节点出现问题,SQL仍可完成执行。
3. 开放性
Hive支持用户自定义函数,用户可根据自己的需求来实现自定义函数。
4. 增强的多字符分隔符
原生的Hive只支持单字符作为列分隔符,而实际应用中存在多个字符作为分隔符的情况,Insight HD Hive支持多字符作为列分隔符。