首页技术文章正文

HBase数据库物理存储的存储方式介绍【大数据文章】

更新时间:2020-12-17 来源:黑马程序员 浏览量:

1577370495235_学IT就到黑马程序员.gif

  HBase分布式数据库最重要的就是存储数据,下面,从四个方面详细介绍HBase的物理存储。

  1.HBase表的数据按照行键RowKey的字典序进行排列,并且切分多个HRegion存储,存储方式如图1所示。

1608171682637_1.jpg

   图1 Region在行方向上的存储

  2.每个Region存储的数据是有限的,如果当Region增大到一个阀值(128)时,会被等分切成两个新的Region,切分方式如图2所示。

1608171690578_2.jpg

   图2 HRegion的切分

  3.一个HRegion Server上可以存储多个Region,但是每个Region只能被分布到一个HRegion Server上,分布方式如图3所示。

1608171699111_3.jpg

  图3 HRegion的分布

  4.MemStore中存储的是用户写入的数据,一旦MemStore存储达到阈值时,里面存储的数据就会被刷新到新生成的StoreFile中(底层是HFile),该文件是以HFile的格式存储到HDFS上,具体如图4所示。

1608171707892_4.jpg

   图4 HBase表的存储



猜你喜欢:

Linux系统如何配置虚拟机网络?

HDFS分布式文件系统的优点缺点有哪些?

黑马程序员大数据培训课程 

分享到:
在线咨询 我要报名
和我们在线交谈!