HBase是如何保证数据的强一致性的

本篇内容介绍了“HBase是如何保证数据的强一致性的”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

我们提供的服务有:网站设计、网站建设、微信公众号开发、网站优化、网站认证、清镇ssl等。为千余家企事业单位解决了网站和推广的问题。提供周到的售前咨询和贴心的售后服务,是有科学管理、有技术的清镇网站制作公司


HBase是如何保证数据的强一致性的?  

有三个方面可以说的,另外HBase是牺牲了数据的可用性来保证它的数据强一致性的,即CAP原理中放弃了A,HBase是个cp系统。

1. HBase中每一条数据只会出现在一个Region,它的数据冗余备份不是在region这个层面做的,还是依赖HDFS来做的冗余。

而且同一时间一个Region只会被分配给一个RegionServer,这就保证了系统中只会有一条可以使用的数据。

2. HBase支持行级事物,即一个put操作要么成功,要么失败。

3. 另外当有RegionServer宕机的时候,Region会被分配到其他的RegionServer上,同时重写WAL Log,这个过程中整个Region中的数据是不可用的,因为它是缺失的。

如果可用的话那么必定会有数据不一致的问题(即写入过的数据查询不到),所以这里用可用性来换取了强一致性,等到WAL写完,保证了数据完整性之后,才可重新访问。

LSM-Tree结构为何写入比读取快那么多?

LSM-Tree结构写入快的原因是它将对数据的修改增量保持在内存中,达到指定的大小限制后才将这些修改操作批量写入磁盘;

读取的时候会比较麻烦,需要合并磁盘中历史数据和内存中最近修改操作,所以写入性能大大提升,读取时可能需要先看是否命中内存,否则需要访问较多的磁盘文件。

极端的说,基于LSM树实现的HBase的写性能比MySQL高了一个数量级,读性能低了一个数量级。

如果 HMaster 挂了,会对HBase集群造成什么影响?

说清楚HMaster的指责基本就能解决问题了

  1. HMaster负责为RegionServer分配Region

  2. 负责RegionServer的负载均衡

  3. 发现失效的RegionServer并重新分配其上的region

  4. 管理用户对table的增删改查操作

所以HMaster宕机后数据的读取和写入还是正常的,但是无法对table进行操作,region的分配的相关操作也会无法进行。

“HBase是如何保证数据的强一致性的”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站,小编将为大家输出更多高质量的实用文章!


分享题目:HBase是如何保证数据的强一致性的
文章分享:http://csdahua.cn/article/ippioc.html
扫二维码与项目经理沟通

我们在微信上24小时期待你的声音

解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流