[关闭]
@zhangyy 2021-05-26T16:49:15.000000Z 字数 419 阅读 126

impala 部分

协作框架


  • 一:impala 的 介绍
  • 二:impala 的安装
  • 三:impala 的常见使用

一: impala 的介绍:

1.1 impala 的起源于应用

  1. 1. cloudera 公司退出,提供对hdfs,hbase 数据的高性能,低延迟的交互式SQL 查询功能。
  2. 2. 基于对hive 使用的内存计算,兼顾数据仓库,具有实时,批处理,多并发等优点。
  3. 3. CDH 平台首选PB级别大数据实时查询分析引擎

1.2 impala 特点

  1. 1. 基于内存进行计算,能够对PB 级别数据进行交互式实时查询,分析
  2. 2. 无需转换为MR,直接读取HDFS数据
  3. 3. C++ 编写,LLVM 统一编译运行
  4. 4.兼容HiveSQL
  5. 5.具有数据仓库的特性,可对hive数据直接做数据分析
  6. 6.支持Data Local
  7. 7.支持列式存储
  8. 8.支持jdbc/odbc 远程访问

image_1bo8scrsu561gkkmhj1qbh14ub9.png-788.8kB


1.3 impala 劣势

  1. 1. 对内存依赖大
  2. 2. C++ 编写 开源
  3. 3. 完全依赖于hive
  4. 4. 实践过程中分区个数超过1W 性能严重下下降
  5. 5. 稳定性能不如hive

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注