[关闭]
@zhangyy 2020-12-08T15:19:56.000000Z 字数 1607 阅读 120

大数据运维HBase 的体系结构

大数据运维系列



一: HBase分布式存储数据库-特性&应用场景

  1. 高可用高扩展强一致
  2. 强一致性高可用高扩展
  3. 海量数据存储
  4. 支持PB级百万列存储、非结构化存储
  5. 高并发、低延迟
  6. 千万级高并发,毫秒级延迟
  7. 自动分配
  8. HBase表通过区域分布在集群上,随着数据的增长,区域会自动分割和重新分布

image_1ejr4lj6o1croold1pdm14qo1pbf9.png-452.5kB


二:HBase体系结构、原理、运行机制(1)

image_1ejr5knnn32h1bq31qkqo6g2pp.png-371.1kB

  1. HMaster
  2. 管理用户对Table的增、删、改、查操作
  3. 管理HRegionServer的负载均衡,调整Region分布
  4. Region Split后,负责新Region的分配
  5. HRegionServer停机后,负责失效HRegionServer 上的Regions迁移
  6. ----
  7. HRegionServer
  8. 主要负责响应用户I/O请求,向HDFS文件系统中读写数据,是HBase中最核心的模块
  9. HRegion
  10. Table在行的方向上分隔为多个RegionRegionHBase中分布式存储和负载均衡的最 小单元,即不同的region可以分别在不同的Region Server上,但同一个Region是不会拆分到多个server上。
  11. HStore
  12. HStoreHBase中存储的核心,每个store保存一个columns family,一个HStore由一个MemStore 0个或多个StoreFile组成
  13. MemStore
  14. 一个写缓存(In Memory Sorted Buffer),所有数据的写在完成WAL日志写后,会 写入MemStore中,由MemStore根据一定的算法将数据Flush到地层HDFS文件中(HFile),通常每个HRegion中的每个 Column Family有一个自己的MemStore
  15. HFile
  16. 用于存储HBase的数据(Cell/KeyValue)。在HFile中的数据是按RowKeyColumn FamilyColumn排序,对相同的Cell(即这三个值都一样),则按timestamp倒序排列

  1. HRegion Server主要负责响应用户的读写请求,内部管理了一系列HRegion对象,每个HRegion对应了Table中的一个RegionRegion中由多个Store组成。每个Store对应了Table中的一个列族的存储,Store存储是Hbase 存储的核心了,
  2. 其中由两部分组成,一部分是MemStore,一部分是StoreFilesMemStoreSorted
  3. Memory Buffer,用户写入的数据首先会放入MemStore,当MemStore满了以后会Flush
  4. 一个StoreFile(底层实现是HFile)。

image_1ejr71q9c6481jtn15ue3gn10d616.png-346.9kB


三:HBase体系结构、原理、运行机制(3)

image_1ejr76pfg3061r3qgh817hviq51j.png-120.3kB

  1. HRegionHbase中分布式存储和负载均衡的最小单元。最
  2. 小单元就表示不同的Hregion可以分布在不的Hregion
  3. server上,但一个Hregion是不会拆分到多个server上的;
  4. Table中的所有行都按照row key的字典序排列,HBase使
  5. RowKey将表水平切割成多个HRegion,从HMaster
  6. 角度, 通过将region切分在许多机器上实现分布式,每个
  7. HRegion都纪录了它的StartKeyEndKey,由于RowKey
  8. 是排序的,因而Client可以通过Hmaster快速的定位每个
  9. RowKey在哪个HRegion

image_1ejr77q0d156rcd6a5ljus1ih820.png-81.4kB

  1. HRegion虽然是分布式存储的最小单元,但并不是
  2. 存储的最小单元。事实上,HRegion由一个或者多个
  3. Store组成,每个store保存一个olumns family,每
  4. Strore又由一个memStore0至多个StoreFile
  5. 成,StoreFileHFile格式保存在HDFS
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注