[关闭]
@yulongsun 2018-10-09T07:00:46.000000Z 字数 1000 阅读 957

HBase

大数据


基本概念

HBase(Hadoop Database)是一种NoSQL的KV数据库,是基于Google BigTable的一个开源实现。
HBase工作在HDFS纸上,因此具有高度的扩展性。

HBase不是一个关系型数据库,HBase定义了一个四维数据模型,具体是:

设计主要思想

image_1cp9tucvockoo9l15ou110fi3j39.png-197.8kB

物理模型

HBase中的LSM(日志结构树)存储思想--解决磁盘随机读写问题
合并排序算法是批量的,且是顺序存储
image_1cp9q42o2usodep16pu1vf13ehp.png-64.1kB

HBase Region解析
HBase HFile解析--解决数据索引问题(只有索引才能高效读)
HBase WAL解析--解决数据持久化问题(面对故障的持久化方案)
HBase Compaction解析

LSM - 解决磁盘随机写问题(顺序写才是王道);
HFile - 解决数据索引问题(只有索引才能高效读);
WAL - 解决数据持久化(面对故障的持久化解决方案);
zooKeeper - 解决核心数据的一致性和集群恢复;
Replication - 引入类似MySQL的数据复制方案,解决可用性;

HBase API

Get(读)
Put(写)
Delete(删)
Scan(扫描)
Increment(列值递增)

详情:

适用场景

最大的缺点就是:不支持条件查询

面试题

  1. HBase和Hive的区别?
  2. HBase中RowKey的设计原则?
  3. 以start-hbase.sh为起点,HBase的启动流程是?
  4. 行式存储和列式存储的优缺点?
    • 行式:随机读写性能高--OLTP事务性
    • 列式:顺序写性能高--OLAP分析性

  1. https://blog.csdn.net/haohaixingyun/article/details/52819563
  2. https://blog.csdn.net/HaixWang/article/details/79514886#1hbase%E7%9A%84%E6%9E%B6%E6%9E%84%E5%92%8C%E5%9F%BA%E6%9C%AC%E5%8E%9F%E7%90%86
  3. 高性能分布式数据库HBase
  4. HBase的安装与运行
  5. 大数据Hbase 面试题
  6. Hbase相关面试题
  7. 寻找HBase的替代者
  8. Hbase技术详细学习笔记
  9. HBase核心知识点总结
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注