= cloud base = * 說明: cloudbase 在目前使用過的解讀下,可稱之為運用在hadoop的database,可以輕易的使用sql語法進行hadoop資料的分析。 * 與hbase的不同:目前認為,cloud base比hbase 方便的一點在於,hbase必須在mapreduce的程式碼中加入把結果塞入hbase的code,而cloud卻不用,只要把cloud執行起來之後,他就會不斷的監聽hadoop並將hadoop的結果自行紀錄於自己的database,如此一來只要對cloud base進行sql的語法查詢就可以撈出資訊 = 安裝步驟 = == step 0: 準備相關軟件: == 下載hadoop-0.18.3.tar.gz [http://www.apache.org/dist/hadoop/core/hadoop-0.18.3/hadoop-0.18.3.tar.gz] 下載cloudbase最新版(目前使用 cloudbase 1.3) [http://sourceforge.net/projects/cloudbase] [http://downloads.sourceforge.net/cloudbase/cloudbase-1.3.tar.gz?use_mirror=jaist] == step 1 : 安裝設定hadoop == * 請參考之前的hadoop安裝教學 或 nutch 的安裝教學 * 執行到start-all.sh ,亦即啟動hadoop環境並執行中... * 確認服務正常: {{{ $ jps 24376 NameNode 24471 DataNode 24579 SecondaryNameNode 24882 JobShell 24665 JobTracker 24769 TaskTracker 28090 Jps $ }}} == step 2 : 啟動CloudBase == * 安裝cloudbase {{{ $ cd /opt/ $ tar xvzf cloudbase-1.3.tar.gz $ ln -sf /opt/cloudbase-1.3 /opt/cloudbase }}} * 修改 cloudbase-env {{{ $ vim /opt/cloudbase/bin/cloudbase-env }}} * 內容為: {{{ #!sh # Set the hadoop home dir HADOOP_HOME=/home/hadoop/hadoop export HADOOP_HOME }}} * 啟動 cloudbase {{{ $ cd /opt/cloudbase/bin/ $ ./start-cloudbase & }}} * 記得執行$cloudbase/test/bin/setup 以建立測試的資料表(此步驟連官網都沒有,但最後一直沒有test_table出現,找了很久才找到要執行此步) == step 3 : 用SQuirreL SQL 檢視 == 首先下載client 端軟件,SQuirreL SQL Client 。 [http://squirrel-sql.sourceforge.net/] [http://jaist.dl.sourceforge.net/sourceforge/squirrel-sql/squirrel-sql-3.0-install.jar] 執行點擊兩下下載下來的 squirrel-sql-3.0-install.jar即可安裝,下一步即可\ * Drivers -> New Driver -> name: CloudBase JDBC Driver , example url : jdbc:cloudbase://localhost:4444, class name : com.business.cloudbase.CBDriver , ultra class path : /opt/cloudbase/build/jar/cloudbasejdbc-1.3.jar -> ok * Aliases -> user : test , password: test -> connect * SQL -> select * FROM test_table1 -> 點小黑人在跑的圖示 -> 就有結果出現囉! * enjoy