Changes between Version 23 and Version 24 of jazz/Hadoop_Lab3


Ignore:
Timestamp:
Mar 28, 2009, 11:40:37 AM (15 years ago)
Author:
waue
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • jazz/Hadoop_Lab3

    v23 v24  
    11[[PageOutline]]
     2
     3----------
     4add some env explain.
     5----------
    26
    37= 實作三: Hadoop 叢集安裝 =
     
    1317 * 這個實做會架設運作在叢集環境上的Hadoop,因此若是你的電腦還存在著之前的實做一的環境,請先作step 0,以移除掉之前的設定。
    1418
    15  * 以下pc001代表你Node 1 的ip位址,pc002為你Node 2 的ip位址,請查清楚之後作設定
     19 * 以下node01代表你Node 1 的ip位址,node02為你Node 2 的ip位址,請查清楚之後作設定
    1620 
    1721 * 為了簡化操作步驟,'''大部分的指令在Node 1 執行即可,不過step2 的安裝java則需要在Node 2 上實機操作喔!'''
     
    4650{{{
    4751~$ sudo su -
    48 ~# echo "192.168.100.1 pc001" >> /etc/hosts
    49 ~# echo "192.168.100.2 pc002" >> /etc/hosts
     52~# echo "192.168.100.1 node01" >> /etc/hosts
     53~# echo "192.168.100.2 node02" >> /etc/hosts
    5054}}}
    5155
     
    6569~$ ssh-keygen -t rsa -f ~/.ssh/id_rsa -P ""
    6670~$ cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
    67 ~$ scp -r ~/.ssh pc002:~/
    68 ~$ ssh pc002
     71~$ scp -r ~/.ssh node02:~/
     72~$ ssh node02
    6973~$ alias ssh='ssh -o "StrictHostKeyChecking no"'
    70 ~$ ssh pc001
     74~$ ssh node01
    7175~$ exit
    7276~$ exit
     
    133137  <property>
    134138    <name>fs.default.name</name>
    135     <value>hdfs://pc001:9000/</value>
     139    <value>hdfs://node01:9000/</value>
    136140    <description> </description>
    137141  </property>
    138142  <property>
    139143    <name>mapred.job.tracker</name>
    140     <value>pc002:9001</value>
     144    <value>node02:9001</value>
    141145    <description>  </description>
    142146  </property>
     
    149153}}}
    150154   * 注意! 我們多加了一個參數hadoop.tmp.dir,讓預設的中介資料存放在/tmp/hadoop/ 而不是/tmp/ 下,更多內容可以看conf/hadoop-default.xml
    151    * 注意!fs.default.name = hdfs://pc001:9000/ ;而mapred.job.tracker = pc002:9001,看出差異了嗎!一個有指hdfs://,一個沒有,重要!易混淆。
     155   * 注意!fs.default.name = hdfs://node01:9000/ ;而mapred.job.tracker = node02:9001,看出差異了嗎!一個有指hdfs://,一個沒有,重要!易混淆。
    152156   
    153157 == step 6. 設定masters及slaves ==
     
    161165{{{
    162166#!sh
    163 pc001
    164 pc002
     167node01
     168node02
    165169}}}
    166170
     
    169173 * 在Node 1 上對遠端Node 2 作開資料夾/opt/hadoop及權限設定
    170174{{{
    171 /opt/hadoop$ ssh pc002 "sudo mkdir /opt/hadoop"
    172 /opt/hadoop$ ssh pc002 "sudo chown -R hadooper:hadooper /opt/hadoop"
     175/opt/hadoop$ ssh node02 "sudo mkdir /opt/hadoop"
     176/opt/hadoop$ ssh node02 "sudo chown -R hadooper:hadooper /opt/hadoop"
    173177}}}
    174178
    175179 * 複製Node 1 的hadoop資料夾到Node 2 上
    176180{{{
    177 /opt/hadoop$ scp -r /opt/hadoop/* pc002:/opt/hadoop/
     181/opt/hadoop$ scp -r /opt/hadoop/* node02:/opt/hadoop/
    178182}}}
    179183
     
    192196/************************************************************
    193197STARTUP_MSG: Starting NameNode
    194 STARTUP_MSG:   host = pc002
     198STARTUP_MSG:   host = node02
    195199STARTUP_MSG:   args = [-format]
    196200STARTUP_MSG:   version = 0.18.3
     
    20420809/03/23 20:19:47 INFO dfs.NameNode: SHUTDOWN_MSG:
    205209/************************************************************
    206 SHUTDOWN_MSG: Shutting down NameNode at pc002
     210SHUTDOWN_MSG: Shutting down NameNode at node02
    207211************************************************************/
    208212}}}
     
    220224
    221225------
    222    * http://pc001:50070/ - Hadoop DFS 狀態
     226   * http://node01:50070/ - Hadoop DFS 狀態
    223227   * [[Image(datanode.png)]]
    224228------
    225229   
    226    * ps: 然而JobTracker還沒啟動,因此 http://pc002:50030/ 網頁無法顯示
     230   * ps: 然而JobTracker還沒啟動,因此 http://node02:50030/ 網頁無法顯示
    227231
    228232 * bin/start-mapred.sh腳本會參照jobtracker上${HADOOP_CONF_DIR}/slaves文件的內容,在所有列出的slave上啟動tasktracker。
     
    231235   
    232236{{{
    233 /opt/hadoop$ ssh pc002 "/opt/hadoop/bin/start-mapred.sh"
     237/opt/hadoop$ ssh node02 "/opt/hadoop/bin/start-mapred.sh"
    234238}}}
    235239
    236240 * 啟動之後, jobtracker也正常運作囉!
    237241------
    238    * http://pc002:50030/ - Hadoop 管理介面
     242   * http://node02:50030/ - Hadoop 管理介面
    239243   * [[Image(job.png)]]
    240244------