@zhangyy
2021-05-26T16:49:15.000000Z
字数 419
阅读 128
协作框架
- 一:impala 的 介绍
- 二:impala 的安装
- 三:impala 的常见使用
1. cloudera 公司退出,提供对hdfs,hbase 数据的高性能,低延迟的交互式SQL 查询功能。
2. 基于对hive 使用的内存计算,兼顾数据仓库,具有实时,批处理,多并发等优点。
3. 是CDH 平台首选PB级别大数据实时查询分析引擎
1. 基于内存进行计算,能够对PB 级别数据进行交互式实时查询,分析
2. 无需转换为MR,直接读取HDFS数据
3. C++ 编写,LLVM 统一编译运行
4.兼容HiveSQL
5.具有数据仓库的特性,可对hive数据直接做数据分析
6.支持Data Local
7.支持列式存储
8.支持jdbc/odbc 远程访问
1. 对内存依赖大
2. C++ 编写 开源
3. 完全依赖于hive
4. 实践过程中分区个数超过1W 性能严重下下降
5. 稳定性能不如hive