安裝HBASE - twilighthook/BigDataNote GitHub Wiki

HBASE特點

  • HBASE是在分布式系統中一個以欄家族導向的分散式資料庫,建置於HDFS上,若要對於海量資料的讀寫,就是於使用HBASE的Hadoop應用。

  • 其中有一個蠻重要的東西:row key,許多spec在設計時row key佔有很重要的一部分。

  • 而之所以他可以應用在分散式資料庫,主要是因為他的區域性,他會將資料表水平切成多個區域,也是因為這樣的分散方式可以平行運算並更快速的得到所要的資料。

  • 就和HDFS和YARN一樣,HBASE是由一個master和多個regionserver所組成的。

  • 而HBASE也很依賴zookeeper來做叢集控管,可以避免master當機而整體崩潰的問題,在安裝裡面可以選擇HBASE default的zookeeper或是自建。

  • HBASE裡面有一個hbase:meta的資料夾(在/hbase/hbase/meta裡面),這是屬於hbase的metadata,hbase:meta存放的是在叢集中的列表、狀態、所有使用者空間區域的位置,在重新佈署hdfs時也會由zookeeper連到hbase:meta進行通訊更新。


HBASE安裝

和其他大數據套件一樣的作法,先到官網下載tar檔

sudo tar -zxvf hbase-x.y.z.tar.gz

之後也是將hbase加到環境變數,在讓環境變數生效

sudo vim ~/.bashrc
> export HBASE_HOME=~/hbase-x.y.z
> export PATH=$PATH:$HBASE_HOME/bin
sudo source /.bashrc

接下來設置HBASE裡面的設定檔

sudo vim hbase-site.xml
<configuration>
<property>
<name>hbase.rootdir</name>
<value>{the_path_in_hdfs}</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>{zookeeper_path}</value>
</property>
</configuration>

接下來就可以開始運作hbase了

start-hbase.sh

這時可以去看hbase的process的狀態、table的資訊、一些log的內容等

localhost:16010
⚠️ **GitHub.com Fallback** ⚠️