Changes between Version 2 and Version 3 of TCCA140822/Lab13


Ignore:
Timestamp:
Sep 27, 2014, 12:48:24 PM (10 years ago)
Author:
jazz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • TCCA140822/Lab13

    v2 v3  
    99<div style="text-align: center;"><big style="font-weight: bold;"><big>在 Koding.com 上安裝 Hadoop<br/>Hadoop installation in Practice</big></big></div>
    1010}}}
     11
     12== STEP 1 : 從 github 取得本次課程的範例 ==
     13
     14{{{
     15~$ git clone https://github.com/jazzwang/hadoop_labs.git
     16}}}
     17
     18 * 您應該會看到類似底下的結果:
     19{{{
     20#!text
     21~$ git clone https://github.com/jazzwang/hadoop_labs.git                                                     
     22Cloning into 'hadoop_labs'...
     23remote: Counting objects: 249, done.
     24remote: Compressing objects: 100% (166/166), done.
     25remote: Total 249 (delta 115), reused 176 (delta 44)
     26Receiving objects: 100% (249/249), 53.64 KiB, done.
     27Resolving deltas: 100% (115/115), done.
     28}}}
     29 * 檢查是否有 hadoop_labs 目錄
     30{{{
     31~$ cd hadoop_labs/
     32~/hadoop_labs$ ls -al
     33}}}
     34
     35== STEP 2 : 執行安裝腳本 ==
     36
     37 * 首先, 我們來介紹 Hadoop 的三種安裝模式
     38 * <參考> http://hadoop.apache.org/docs/stable/single_node_setup.html
     39{{{
     40#!text
     41Now you are ready to start your Hadoop cluster in one of the three supported modes:
     42
     43  * Local (Standalone) Mode
     44  * Pseudo-Distributed Mode
     45  * Fully-Distributed Mode
     46}}}
     47
     48 * 開始動手吧~請剪貼以下的步驟:
     49{{{
     50~$ cd ~/hadoop_labs
     51~/hadoop_labs$ sudo apt-get -y install wget
     52~/hadoop_labs$ lab000/hadoop-local-mode
     53}}}
     54
     55 * 等待安裝的過程中,讓我們來講解 [https://raw.github.com/jazzwang/hadoop_labs/master/lab000/hadoop-local-mode hadoop-local-mode 這隻 Shell Script] 做了哪些事情。
     56   1. 安裝 Java Runtime Environment (JRE) 與 Java Development Kit (JDK) - 雖然目前 Oracle 已經釋出 JDK/JRE7,但 JDK/JRE 6 還是 Hadoop 開發者有經過大量測試驗證的版本。未來若要進行商業運轉,建議安裝 CDH4 或 HDP 搭配 JRE7。
     57   2. 下載 hadoop-$VERSION.tar.gz
     58   3. 解壓縮到 ${HOME}/hadoop
     59   4. 設定 ${HOME}/hadoop/conf.local/hadoop-env.sh
     60   5. 設定 ${HOME}/.bashrc 加入 PATH 環境變數
     61
     62 * 安裝完成,首先先讓我們觀察有幾個 java process
     63{{{
     64~/hadoop_labs$ jps
     65}}}
     66
     67 * 觀察有沒有開 port
     68{{{
     69~/hadoop_labs$ netstat -nap | grep java
     70}}}
     71
     72 * 讓我們來複習一下 HDFS 的基本操作
     73{{{
     74~/hadoop_labs$ cd ~
     75~$ ls
     76~$ source ~/.bashrc
     77~$ hadoop fs -ls
     78~$ hadoop fs -mkdir tmp
     79~$ hadoop fs -ls
     80~$ ls
     81~$ hadoop fs -put ${HOME}/hadoop/conf.local input
     82~$ hadoop fs -ls
     83~$ ls
     84}}}
     85
     86== 實作習題 ==
     87
     88 試回答以下問題:
     89
     90 1. 當您下 jps 指令之後,除了 jps 以外,看到幾個 java process ?
     91{{{
     92#!text
     93    (A) 0,只有 jps 一個結果
     94    (B) 1
     95    (C) 2
     96    (D) 3
     97    (E) 4
     98}}}
     99 2. 回到家目錄,執行 hadoop fs -ls 指令,您看到的結果跟直接下 ls 有無不同?
     100{{{
     101#!text
     102    (A) hadoop fs -ls 會顯示完整路徑,並將隱藏檔案也秀出來. ls 只會秀出一般的檔案
     103    (B) 顯示 can not access
     104}}}
     105 3. 在家目錄, 執行 hadoop fs -mkdir tmp 指令,對家目錄有何影響?
     106{{{
     107#!text
     108    (A) 在家目錄底下多了一個 tmp 目錄
     109    (B) 家目錄沒有任何改變
     110}}}