Changes between Version 2 and Version 3 of 0330Hadoop_Lab3


Ignore:
Timestamp:
Apr 9, 2009, 4:14:05 PM (15 years ago)
Author:
waue
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • 0330Hadoop_Lab3

    v2 v3  
    1010 || || '''管理Data的身份''' || '''管理Job的身份''' ||
    1111 || '''Node 1 ''' || namenode(master)& datanode || tasktracker(slave)||
    12  || '''Node 2 ''' || datanode(slave) || jobtracker(master)& tasktracker||
     12 || '''Node 2 ''' || jobtracker(master)& datanode(slave) || tasktracker||
    1313 
    1414 * 這個實做會架設運作在叢集環境上的Hadoop,因此若是你的電腦還存在著之前的實做一的環境,請先作step 0,以移除掉之前的設定。
     
    4646 
    4747{{{
    48 ~$ alias ssh='ssh -o "StrictHostKeyChecking no"'
     48~$ sudo gedit /etc/ssh/ssh_config
     49}}}
     50 * 把原本的ask改成no
     51{{{
     52#!sh
     53StrictHostKeyChecking no
     54}}}
     55 * 並且把此檔替換到其他node
     56{{{
     57~$ sudo su -
     58~# scp /etc/ssh/ssh_config node2:/etc/ssh/
     59~# exit
     60}}}
     61 * 接著將key複製到其他node上
     62{{{
    4963~$ ssh-keygen -t rsa -f ~/.ssh/id_rsa -P ""
    5064~$ cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
    5165~$ scp -r ~/.ssh node02:~/
     66}}}
     67 * 測試看看是否登入免密碼
     68{{{
    5269~$ ssh node02
    53 ~$ alias ssh='ssh -o "StrictHostKeyChecking no"'
    5470~$ ssh node01
    5571~$ exit
    5672~$ exit
     73~$
    5774}}}
    5875
     
    6683~$ sudo apt-get purge java-gcj-compat
    6784~$ sudo apt-get install sun-java6-bin  sun-java6-jdk sun-java6-jre
     85~$ ssh node2
     86~$ sudo apt-get purge java-gcj-compat
     87~$ sudo apt-get install sun-java6-bin  sun-java6-jdk sun-java6-jre
     88~$ exit
    6889}}}
    6990   
     
    122143  <property>
    123144    <name>mapred.job.tracker</name>
    124     <value>node02:9001</value>
     145    <value>node01:9001</value>
    125146    <description>  </description>
    126147  </property>
     
    133154}}}
    134155   * 注意! 我們多加了一個參數hadoop.tmp.dir,讓預設的中介資料存放在/tmp/hadoop/ 而不是/tmp/ 下,更多內容可以看conf/hadoop-default.xml
    135    * 注意!fs.default.name = hdfs://node01:9000/ ;而mapred.job.tracker = node02:9001,看出差異了嗎!一個有指hdfs://,一個沒有,重要!易混淆。
     156   * 注意!fs.default.name = hdfs://node01:9000/ ;而mapred.job.tracker = node01:9001,看出差異了嗎!一個有指hdfs://,一個沒有,重要!易混淆。
    136157   
    137158 == step 6. 設定masters及slaves ==
     
    178199STARTUP_MSG:   host = node01
    179200STARTUP_MSG:   args = [-format]
     201
    180202
    181203STARTUP_MSG:   version = 0.18.3
     
    209231------
    210232   
    211    * ps: 然而JobTracker還沒啟動,因此 http://node02:50030/ 網頁無法顯示
     233   * ps: 然而JobTracker還沒啟動,因此 http://node01:50030/ 網頁無法顯示
    212234
    213235 * bin/start-mapred.sh腳本會參照jobtracker上${HADOOP_CONF_DIR}/slaves文件的內容,在所有列出的slave上啟動tasktracker。
     
    216238   
    217239{{{
    218 /opt/hadoop$ ssh node02 "/opt/hadoop/bin/start-mapred.sh"
     240/opt/hadoop$ /opt/hadoop/bin/start-mapred.sh
    219241}}}
    220242
    221243 * 啟動之後, jobtracker也正常運作囉!
    222244------
    223    * http://node02:50030/ - Hadoop 管理介面
     245   * http://node01:50030/ - Hadoop 管理介面
    224246   * [[Image(job.png)]]
    225247------