Apache HBase官方版是一款非常專業的Hadoop數據庫管理工具,我們可以通過這款軟件來隨時隨地讀取訪問各種大數據。并且這款軟件還可以用來低延遲訪問數十億條記錄中的單行,非常強大。
Apache HBase是Hadoop數據庫是一個分布式、可擴展的大數據存儲,當你需要隨機、實時地讀/寫訪問你的大數據時,請使用Apache HBase,Apache HBase是一個開源的、分布式的、版本化的、非關系型的數據庫,以Google的Bigtable為模型。正如Bigtable利用谷歌文件系統提供的分布式數據存儲一樣,Apache HBase在Hadoop和HDFS之上提供了類似Bigtable的功能。
線性可擴展。
一致的讀寫。
表的自動和可配置分片
對區域服務器的自動故障轉移支持。
與Hadoop集成,作為源和目標。
易于使用的基于Java的API用于客戶端訪問。
低延遲訪問數十億條記錄中的單行。
快速查找較大的表。
Thrift網關和支持XML,Protobuf和二進制數據編碼選項的REST-ful Web服務
可擴展的基于Jruby的(JIRB)Shell
支持通過Hadoop指標子系統將指標導出到文件或Ganglia;或通過JMX
1.Native Java API,最常規和高效的訪問方式,適合Hadoop MapReduce Job并行批處理HBase表數據
2.HBase Shell,HBase的命令行工具,最簡單的接口,適合HBase管理使用
3.Thrift Gateway,利用Thrift序列化技術,支持C++,PHP,Python等多種語言,適合其他異構系統在線訪問HBase表數據
4.REST Gateway,支持REST 風格的Http API訪問HBase, 解除了語言限制
5.Pig,可以使用Pig Latin流式編程語言來操作HBase中的數據,和Hive類似,本質最終也是編譯成MapReduce Job來處理HBase表數據,適合做數據統計
6.Hive,當前Hive的Release版本尚沒有加入對HBase的支持,但在下一個版本Hive 0.7.0中將會支持HBase,可以使用類似SQL語言來訪問HBase