hbase快速入門與使用教程

HBase簡(jiǎn)介

HBase是一個(gè)分布式的、面向列的開源數(shù)據(jù)庫，該技術(shù)來源于 Fay Chang 所撰寫的Google論文“Bigtable：一個(gè)結(jié)構(gòu)化數(shù)據(jù)的分布式存儲(chǔ)系統(tǒng)”。就像Bigtable利用了Google文件系統(tǒng)（File System）所提供的分布式數(shù)據(jù)存儲(chǔ)一樣，HBase在Hadoop之上提供了類似于Bigtable的能力。HBase是Apache的Hadoop項(xiàng)目的子項(xiàng)目。HBase不同于一般的關(guān)系數(shù)據(jù)庫，它是一個(gè)適合于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)庫。另一個(gè)不同的是HBase基于列的而不是基于行的模式。

什么時(shí)候需要HBase呢？

半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)，對(duì)于數(shù)據(jù)結(jié)構(gòu)字段不夠確定或雜亂無章很難按一個(gè)概念去進(jìn)行抽取的數(shù)據(jù)適合用HBase。當(dāng)業(yè)務(wù)發(fā)展需要存儲(chǔ)author的email，phone，address信息時(shí)RDBMS需要停機(jī)維護(hù)，而HBase支持動(dòng)態(tài)增加。

記錄非常稀疏

RDBMS的行有多少列是固定的，為null的列浪費(fèi)了存儲(chǔ)空間。而如上文提到的，HBase為null的Column不會(huì)被存儲(chǔ)，這樣既節(jié)省了空間又提高了讀性能。

多版本數(shù)據(jù)

如上文提到的根據(jù)Row key和Column key定位到的Value可以有任意數(shù)量的版本值，因此對(duì)于需要存儲(chǔ)變動(dòng)歷史記錄的數(shù)據(jù)，用HBase就非常方便了。比如上例中的author的Address是會(huì)變動(dòng)的，業(yè)務(wù)上一般只需要最新的值，但有時(shí)可能需要查詢到歷史值。

超大數(shù)據(jù)量

當(dāng)數(shù)據(jù)量越來越大，RDBMS數(shù)據(jù)庫撐不住了，就出現(xiàn)了讀寫分離策略，通過一個(gè)Master專門負(fù)責(zé)寫操作，多個(gè)Slave負(fù)責(zé)讀操作，服務(wù)器成本倍增。隨著壓力增加，Master撐不住了，這時(shí)就要分庫了，把關(guān)聯(lián)不大的數(shù)據(jù)分開部署，一些join查詢不能用了，需要借助中間層。隨著數(shù)據(jù)量的進(jìn)一步增加，一個(gè)表的記錄越來越大，查詢就變得很慢，于是又得搞分表，比如按ID取模分成多個(gè)表以減少單個(gè)表的記錄數(shù)。經(jīng)歷過這些事的人都知道過程是多么的折騰。采用HBase就簡(jiǎn)單了，只需要加機(jī)器即可，HBase會(huì)自動(dòng)水平切分?jǐn)U展，跟Hadoop的無縫集成保障了其數(shù)據(jù)可靠性（HDFS）和海量數(shù)據(jù)分析的高性能（MapReduce）。

hbase快速入門與使用教程

HTable一些基本概念

Row key

行主鍵， HBase不支持條件查詢和Order by等查詢，讀取記錄只能按Row key（及其range）或全表掃描，因此Row key需要根據(jù)業(yè)務(wù)來設(shè)計(jì)以利用其存儲(chǔ)排序特性（Table按Row key字典序排序如1，10，100，11，2）提高性能。

Column Family（列族）

在表創(chuàng)建時(shí)聲明，每個(gè)Column Family為一個(gè)存儲(chǔ)單元。在上例中設(shè)計(jì)了一個(gè)HBase表blog，該表有兩個(gè)列族：article和author。

Column（列）

HBase的每個(gè)列都屬于一個(gè)列族，以列族名為前綴，如列article:title和article:content屬于article列族，author:name和author:nickname屬于author列族。

Column不用創(chuàng)建表時(shí)定義即可以動(dòng)態(tài)新增，同一Column Family的Columns會(huì)群聚在一個(gè)存儲(chǔ)單元上，并依Column key排序，因此設(shè)計(jì)時(shí)應(yīng)將具有相同I/O特性的Column設(shè)計(jì)在一個(gè)Column Family上以提高性能。

Timestamp

HBase通過row和column確定一份數(shù)據(jù)，這份數(shù)據(jù)的值可能有多個(gè)版本，不同版本的值按照時(shí)間倒序排序，即最新的數(shù)據(jù)排在最前面，查詢時(shí)默認(rèn)返回最新版本。如上例中row key=1的author:nickname值有兩個(gè)版本，分別為1317180070811對(duì)應(yīng)的“一葉渡江”和1317180718830對(duì)應(yīng)的“yedu”（對(duì)應(yīng)到實(shí)際業(yè)務(wù)可以理解為在某時(shí)刻修改了nickname為yedu，但舊值仍然存在）。Timestamp默認(rèn)為系統(tǒng)當(dāng)前時(shí)間（精確到毫秒），也可以在寫入數(shù)據(jù)時(shí)指定該值。

Value

每個(gè)值通過4個(gè)鍵唯一索引，tableName+RowKey+ColumnKey+Timestamp=》value，例如上例中{tableName=’blog’，RowKey=’1’，ColumnName=’author:nickname’，Timestamp=’ 1317180718830’}索引到的唯一值是“yedu”。

存儲(chǔ)類型

TableName 是字符串

RowKey 和 ColumnName 是二進(jìn)制值（Java 類型 byte［］）

Timestamp 是一個(gè) 64 位整數(shù)（Java 類型 long）

value 是一個(gè)字節(jié)數(shù)組（Java類型 byte［］）。

將HTable的存儲(chǔ)結(jié)構(gòu)理解為

即HTable按Row key自動(dòng)排序，每個(gè)Row包含任意數(shù)量個(gè)Columns，Columns之間按Column key自動(dòng)排序，每個(gè)Column包含任意數(shù)量個(gè)Values。理解該存儲(chǔ)結(jié)構(gòu)將有助于查詢結(jié)果的迭代。

閱讀全文

12 3 4 下一頁全文

本文導(dǎo)航

第 1 頁：hbase快速入門與使用教程
第 2 頁：HTable使用教程
第 3 頁：新增、更新數(shù)據(jù)Put
第 4 頁：獲取單行Get

Hbase(11089) Hbase(11089)

評(píng)論

相關(guān)推薦

HBase read replicas 功能介紹系列

摘要：主要介紹HBase 在讀可用性這塊做的read replica 功能的大概介紹，包括：基本使用，讀寫流程的大概鏈路，設(shè)計(jì)的折中等等。HBase read replicas1.概述對(duì)于這個(gè)模塊

2018-06-12 16:02:47

HBase2.0中的Benchmark工具 — PerformanceEvaluation

　　摘要：在項(xiàng)目開發(fā)過程中，我們經(jīng)常需要一些benchmark工具來對(duì)系統(tǒng)進(jìn)行壓測(cè)，以獲得系統(tǒng)的性能參數(shù)，極限吞吐等等指標(biāo)。而在HBase中，就自帶了一個(gè)benchmark工具

2018-06-13 15:07:58

HBase安裝與操作指南

HBase初識(shí)、CentOS66中HBase安裝與HBase Shell簡(jiǎn)單使用

2019-09-20 14:51:36

HBase性能優(yōu)化方法總結(jié)

HBase是Hadoop生態(tài)系統(tǒng)中的一個(gè)組件，是一個(gè)分布式、面向列的開源數(shù)據(jù)庫，可以支持?jǐn)?shù)百萬列、超過10億行的數(shù)據(jù)存儲(chǔ)，因此，對(duì)HBase性能提出了一定的要求，那么如何進(jìn)行HBase性能優(yōu)化呢

2018-04-20 17:16:47

HBase性能調(diào)優(yōu)概述

HBase性能調(diào)優(yōu)

2019-07-03 11:35:56

HBase架構(gòu)的特點(diǎn)和讀寫流程

HBase架構(gòu)詳解析

2019-05-15 11:14:20

HBase表微博存儲(chǔ)系統(tǒng)項(xiàng)目

HBase應(yīng)用（三）：HBase表設(shè)計(jì)實(shí)踐

2019-06-18 13:11:38

Hbase shell的基本操作完整流程

HBase的命令行工具，最簡(jiǎn)單的接口，適合HBase管理使用，可以使用shell命令來查詢HBase中數(shù)據(jù)的詳細(xì)情況。安裝完HBase之后，啟動(dòng)hadoop集群(利用hdfs存儲(chǔ))，啟動(dòng)

2018-09-11 16:14:30

hbase shell創(chuàng)建命名空間

一.hbase shell創(chuàng)建命名空間hbase shellcreate_namespace "gofish"二.python實(shí)現(xiàn)hbase增刪改查# -*- coding

2021-07-28 06:45:49

hbase shell的操作類別

Hbase shell的基本操作

2019-08-28 09:08:33

hbase數(shù)據(jù)庫方法

hbase 數(shù)據(jù)庫的安裝與簡(jiǎn)單應(yīng)用

2019-09-18 08:52:48

CAN總線快速入門

2012-08-07 16:07:56

CAN總線快速入門

2012-08-20 19:20:24

Labview 超快速入門

2013-04-11 18:04:12

Linux的HBase安裝步驟

# /usr/hbase-0.94.16/bin/start-hbase.sh

2019-07-25 06:50:09

PADS Layout快速入門

2013-10-10 13:04:14

PADS快速入門

PADS快速入門，告別繁瑣的操作，使新手快速入門，更快的節(jié)省時(shí)間，很快的融入到工作中

2018-07-30 16:50:35

RL78G13快速入門教材

2015-08-11 09:27:31

RT-Thread快速入門文檔

。目錄RT-Thread 快速入門文檔RT-Thread 快速入門實(shí)例教程準(zhǔn)備環(huán)境初識(shí) RT-Thread系統(tǒng)啟動(dòng)代碼用戶入口代碼跑馬燈的例子生產(chǎn)者 - 消費(fèi)者問題其他例子Keil下搭建

2019-01-22 22:00:18

STM32如何才能快速入門？

我是學(xué)單片機(jī)好還是直接學(xué)STM32好？？？STM32如何才能快速入門？為什么是STM32呢？為什么不是ARM9，ARM11呢？

2021-02-22 06:59:32

Synplify快速入門

2012-08-13 17:20:43

labview快速入門

labview快速入門手冊(cè)

2013-09-08 14:33:18

python是如何實(shí)現(xiàn)hbase增刪改查的

hbase shell是怎樣去創(chuàng)建命名空間的？python是如何實(shí)現(xiàn)hbase增刪改查的？求解

2021-10-19 07:26:14

【HBase從入門到精通系列】如何避免HBase寫入過快引起的各種問題

寫入。兩個(gè)相關(guān)參數(shù)的默認(rèn)值如下：hbase.hregion.memstore.flush.size=128Mhbase.hregion.memstore.block.multiplier=4或者這樣

2018-04-10 13:36:40

企業(yè)打開云HBase的正確方式，來自阿里云云數(shù)據(jù)庫團(tuán)隊(duì)的解讀

。伴隨著互聯(lián)網(wǎng)時(shí)代數(shù)據(jù)的澎湃增長，HBase作為基礎(chǔ)存儲(chǔ)系統(tǒng)得到了快速發(fā)展與應(yīng)用，大批知名商業(yè)公司(Facebook、Yahoo、阿里等)自主地加入到了HBase生態(tài)建設(shè)隊(duì)伍，成為Apache最活躍

2018-05-31 15:57:40

值得學(xué)習(xí)的HBase讀寫優(yōu)化參考

HBase讀寫優(yōu)化

2019-02-25 16:40:02

兌吧：從自建HBase遷移到阿里云HBase實(shí)戰(zhàn)經(jīng)驗(yàn)

的用戶體驗(yàn)，目前推啊已經(jīng)服務(wù)超過15000家媒體，阿里云hbase主要服務(wù)于"推啊"的廣告業(yè)務(wù)。"推啊"的整體業(yè)務(wù)流程如下圖：整體產(chǎn)品架構(gòu)廣告平臺(tái)基礎(chǔ)架構(gòu)完善

2018-06-19 17:32:22

關(guān)于HBase的學(xué)習(xí)筆記

初識(shí)HBase（一些HBase學(xué)習(xí)筆記）

2020-04-21 15:07:19

關(guān)于Hbase的全面介紹

Hbase原理與使用

2019-07-25 14:58:41

再談全局網(wǎng)HBase八大應(yīng)用場(chǎng)景

摘要： HBase可以說是一個(gè)數(shù)據(jù)庫，也可以說是一個(gè)存儲(chǔ)。擁有雙重屬性的HBase天生就具備廣闊的應(yīng)用場(chǎng)景。在2.0中，引入了OffHeap降低了延遲，可以滿足在線的需求。引入MOB，可以存儲(chǔ)10M

2018-04-11 11:14:40

國賽用，快速入門

國賽需求，快速入門

2015-08-05 11:11:15

如何快速入門51單片機(jī)？

2021-10-26 06:42:14

如何快速入門Arduino語言？

2021-10-13 06:40:44

如何快速入門DSP

都說FPGA入門簡(jiǎn)單、應(yīng)用難，DSP入門很難、入門了簡(jiǎn)單。小弟初學(xué)DSP，在此請(qǐng)各位大俠指引指引，爭(zhēng)取快速入門。。。

2012-02-27 13:29:06

如何快速入門Labview？

如何快速入門Labview？{:6:}

2013-04-12 11:04:34

如何快速入門Linux？

入門必備零基礎(chǔ)如何快速入門Linux？

2020-06-14 09:19:42

如何快速入門STM32L476R？

2021-11-29 07:41:54

如何快速入門STM32？

2021-11-05 06:04:02

如何快速入門python nodemcu_NodeMCU？

2022-02-15 06:31:37

如何快速入門smt32？

如何快速入門ＳＴＭ３２呢，我的５１單片機(jī)剛開始學(xué)，但是我想是同時(shí)學(xué)習(xí)

2020-05-18 01:11:59

如何快速入門智能車呢

如何快速入門智能車呢？有哪些方法呢？

2021-11-01 07:52:06

誰有好的快速入門學(xué)習(xí)labview的教程啊

導(dǎo)師要求學(xué)習(xí)labview做項(xiàng)目誰有好的快速入門學(xué)習(xí)labview的教程啊麻煩給個(gè)地址，好人一生平安

2016-01-22 15:05:25

阿里HBase的數(shù)據(jù)管道設(shè)施實(shí)踐與演進(jìn)

。HExporter2.0如上圖所示總結(jié)ALiHBase數(shù)據(jù)通道的導(dǎo)入和導(dǎo)出都是添加了中間層，中間層的核心價(jià)值易擴(kuò)展、可靠性高、迭代快和穩(wěn)定。因?yàn)椴捎梅植际剿綌U(kuò)展更易擴(kuò)展；采用自主識(shí)別主備切換，封裝對(duì)HBase訪問更可靠；采用架構(gòu)解耦，快速迭代使迭代速度更快；因?yàn)闊o狀態(tài)，節(jié)點(diǎn)對(duì)等所以更加穩(wěn)定。原文鏈接

2018-05-29 20:34:12

面向列的HBase存儲(chǔ)結(jié)構(gòu)究竟有什么樣的不同之處呢？

HBase是什么？HBase的存儲(chǔ)結(jié)構(gòu)究竟是怎樣的呢？面向列的HBase存儲(chǔ)結(jié)構(gòu)究竟有什么樣的不同之處呢？

2021-06-16 06:52:03

ISE,Keil C和ICCAVR快速入門指南

ISE,Keil C和ICCAVR快速入門指南:ISE6.2I快速入門介紹,Keil C快速入門說明，ICCAVR快速入門使用說明。

2008-11-01 23:20:32

winavr gcc快速入門

winavr gcc快速入門導(dǎo)讀：WinAVR 的配置與 makefile 一直是新手入門的兩個(gè)難點(diǎn)。我們經(jīng)過詳細(xì)的測(cè)試，推薦大家不

2008-10-27 21:11:20

2279

力控組態(tài)軟件快速入門

力控組態(tài)軟件快速入門，力控組態(tài)軟件快速入門，力控組態(tài)軟件快速入門

2015-10-30 18:01:08

CCS 3.3 快速入門

CCS 3.3 快速入門，又需要的朋友下來看看

2016-05-06 15:28:11

ARM_Cortex-M3快速入門

ARM Cortex-m3快速入門，適合m3入門，對(duì)其他ARM芯片學(xué)習(xí)也有幫助。

2016-05-16 14:31:08

CAN總線快速入門

2016-12-13 17:15:19

HBase負(fù)載均衡分析及優(yōu)化策略

HBase負(fù)載均衡分析及優(yōu)化策略_黃偉建

2017-01-03 17:41:32

HBase列族設(shè)計(jì)優(yōu)化實(shí)踐分析

現(xiàn)在，網(wǎng)易視頻云與大家分享一下HBase最佳實(shí)踐－列族設(shè)計(jì)優(yōu)化。隨著大數(shù)據(jù)的越來越普及，HBase也變得越來越流行。會(huì)用HBase現(xiàn)在已經(jīng)變的并不困難，然而，怎么把它用的更好卻并不簡(jiǎn)單。那怎么定義

2017-10-10 10:06:35

HBase客戶端實(shí)踐重試機(jī)制

現(xiàn)在，網(wǎng)易視頻云與大家分享HBase客戶端實(shí)踐重試機(jī)制。在運(yùn)維HBase的這段時(shí)間里，發(fā)現(xiàn)業(yè)務(wù)用戶一方面比較關(guān)注HBase本身服務(wù)的讀寫性能：吞吐量以及讀寫延遲，另一方面也會(huì)比較關(guān)注HBase

2017-10-10 10:15:16

基于HBase行鍵面向海量交通數(shù)據(jù)的HBase時(shí)空索引

針對(duì)HBase無法直接建立時(shí)空索引所帶來的交通數(shù)據(jù)查詢性能問題，基于HBase行鍵設(shè)計(jì)了面向海量交通數(shù)據(jù)的HBase時(shí)空索引。首先利用Geohash降維方法將二維空間位置數(shù)據(jù)轉(zhuǎn)化為一維編碼，再與時(shí)間

2017-12-06 15:23:04

hbase工作原理_hbase超詳細(xì)介紹

HBase是一個(gè)高可靠性、高性能、面向列、可伸縮的分布式存儲(chǔ)系統(tǒng)，利用HBase技術(shù)可在廉價(jià)PC Server上搭建大規(guī)模結(jié)構(gòu)化的存儲(chǔ)集群。hbase工作原理如下所述...

2017-12-27 14:17:27

18162

hbase性能測(cè)試總結(jié)

hbase的寫性能：集群吞吐量最大可以達(dá)到70000+ ops/sec，延遲在幾個(gè)毫秒左右。網(wǎng)絡(luò)帶寬是主要瓶頸，如果將千兆網(wǎng)卡換成萬兆網(wǎng)卡，吞吐量還可以繼續(xù)增加，甚至達(dá)到目前吞吐量的兩倍。hbase

2017-12-27 14:42:12

9902

hbase常用操作命令大全

HBase是Google Bigtable的開源實(shí)現(xiàn)，類似Google Bigtable利用GFS作為其文件存儲(chǔ)系統(tǒng)，HBase利用Hadoop HDFS作為其文件存儲(chǔ)系統(tǒng)；Google運(yùn)行

2017-12-27 15:10:20

2436

hbase分布式安裝部署過程

先下載安裝包，再配置安裝路徑，后驗(yàn)證是否安裝成功。完成以上操作后啟動(dòng)HBase，啟動(dòng)順序：先啟動(dòng)Hadoop，再啟動(dòng)HBase，關(guān)閉順序：先關(guān)閉HBase，再關(guān)閉Hadoop。

2017-12-27 15:26:48

1435

Ali-HBase的SQL實(shí)踐與改進(jìn)

，說到底就是太底層了，提供“原語級(jí)別的操作。我們希望能夠降低用戶的接入門檻，能夠低成本低接入Hbase，怎么做這件事情？阿里HBase大部分場(chǎng)景都是比較簡(jiǎn)單的，并且有共性，所以我們希望能夠引用中間層

2018-08-03 12:11:52

137

HBase是什么 HBase八大應(yīng)用場(chǎng)景介紹

HBase是一個(gè)分布式存儲(chǔ)、數(shù)據(jù)庫引擎，可以支持千萬的QPS、PB級(jí)別的存儲(chǔ)，這些都已經(jīng)在生產(chǎn)環(huán)境驗(yàn)證，并且在廣大的公司已經(jīng)驗(yàn)證。特別是阿里、小米、京東、滴滴內(nèi)部都有數(shù)千、上萬臺(tái)的HBase集群。選擇一個(gè)技術(shù)的首要條件是對(duì)齊大公司，大公司會(huì)投入大量的人力去維護(hù)、改進(jìn)、貢獻(xiàn)社區(qū)。

2018-11-11 11:05:05

9838

阿里云HBase推出全新X-Pack服務(wù) 定義HBase云服務(wù)新標(biāo)準(zhǔn)

2018年12月13日，第八屆中國云計(jì)算標(biāo)準(zhǔn)和應(yīng)用大會(huì)在京召開，會(huì)上阿里云HBase宣布推出全新X-Pack服務(wù)，支持SQL、時(shí)序、時(shí)空、圖、全文檢索能力、復(fù)雜分析，從處理到分析全棧式數(shù)據(jù)庫，客戶

2018-12-24 17:29:37

170