Changes between Version 23 and Version 24 of jazz/Hadoop_Lab3
- Timestamp:
- Mar 28, 2009, 11:40:37 AM (16 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
TabularUnified jazz/Hadoop_Lab3
v23 v24 1 1 [[PageOutline]] 2 3 ---------- 4 add some env explain. 5 ---------- 2 6 3 7 = 實作三: Hadoop 叢集安裝 = … … 13 17 * 這個實做會架設運作在叢集環境上的Hadoop,因此若是你的電腦還存在著之前的實做一的環境,請先作step 0,以移除掉之前的設定。 14 18 15 * 以下 pc001代表你Node 1 的ip位址,pc002為你Node 2 的ip位址,請查清楚之後作設定19 * 以下node01代表你Node 1 的ip位址,node02為你Node 2 的ip位址,請查清楚之後作設定 16 20 17 21 * 為了簡化操作步驟,'''大部分的指令在Node 1 執行即可,不過step2 的安裝java則需要在Node 2 上實機操作喔!''' … … 46 50 {{{ 47 51 ~$ sudo su - 48 ~# echo "192.168.100.1 pc001" >> /etc/hosts49 ~# echo "192.168.100.2 pc002" >> /etc/hosts52 ~# echo "192.168.100.1 node01" >> /etc/hosts 53 ~# echo "192.168.100.2 node02" >> /etc/hosts 50 54 }}} 51 55 … … 65 69 ~$ ssh-keygen -t rsa -f ~/.ssh/id_rsa -P "" 66 70 ~$ cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys 67 ~$ scp -r ~/.ssh pc002:~/68 ~$ ssh pc00271 ~$ scp -r ~/.ssh node02:~/ 72 ~$ ssh node02 69 73 ~$ alias ssh='ssh -o "StrictHostKeyChecking no"' 70 ~$ ssh pc00174 ~$ ssh node01 71 75 ~$ exit 72 76 ~$ exit … … 133 137 <property> 134 138 <name>fs.default.name</name> 135 <value>hdfs:// pc001:9000/</value>139 <value>hdfs://node01:9000/</value> 136 140 <description> </description> 137 141 </property> 138 142 <property> 139 143 <name>mapred.job.tracker</name> 140 <value> pc002:9001</value>144 <value>node02:9001</value> 141 145 <description> </description> 142 146 </property> … … 149 153 }}} 150 154 * 注意! 我們多加了一個參數hadoop.tmp.dir,讓預設的中介資料存放在/tmp/hadoop/ 而不是/tmp/ 下,更多內容可以看conf/hadoop-default.xml 151 * 注意!fs.default.name = hdfs:// pc001:9000/ ;而mapred.job.tracker = pc002:9001,看出差異了嗎!一個有指hdfs://,一個沒有,重要!易混淆。155 * 注意!fs.default.name = hdfs://node01:9000/ ;而mapred.job.tracker = node02:9001,看出差異了嗎!一個有指hdfs://,一個沒有,重要!易混淆。 152 156 153 157 == step 6. 設定masters及slaves == … … 161 165 {{{ 162 166 #!sh 163 pc001164 pc002167 node01 168 node02 165 169 }}} 166 170 … … 169 173 * 在Node 1 上對遠端Node 2 作開資料夾/opt/hadoop及權限設定 170 174 {{{ 171 /opt/hadoop$ ssh pc002 "sudo mkdir /opt/hadoop"172 /opt/hadoop$ ssh pc002 "sudo chown -R hadooper:hadooper /opt/hadoop"175 /opt/hadoop$ ssh node02 "sudo mkdir /opt/hadoop" 176 /opt/hadoop$ ssh node02 "sudo chown -R hadooper:hadooper /opt/hadoop" 173 177 }}} 174 178 175 179 * 複製Node 1 的hadoop資料夾到Node 2 上 176 180 {{{ 177 /opt/hadoop$ scp -r /opt/hadoop/* pc002:/opt/hadoop/181 /opt/hadoop$ scp -r /opt/hadoop/* node02:/opt/hadoop/ 178 182 }}} 179 183 … … 192 196 /************************************************************ 193 197 STARTUP_MSG: Starting NameNode 194 STARTUP_MSG: host = pc002198 STARTUP_MSG: host = node02 195 199 STARTUP_MSG: args = [-format] 196 200 STARTUP_MSG: version = 0.18.3 … … 204 208 09/03/23 20:19:47 INFO dfs.NameNode: SHUTDOWN_MSG: 205 209 /************************************************************ 206 SHUTDOWN_MSG: Shutting down NameNode at pc002210 SHUTDOWN_MSG: Shutting down NameNode at node02 207 211 ************************************************************/ 208 212 }}} … … 220 224 221 225 ------ 222 * http:// pc001:50070/ - Hadoop DFS 狀態226 * http://node01:50070/ - Hadoop DFS 狀態 223 227 * [[Image(datanode.png)]] 224 228 ------ 225 229 226 * ps: 然而JobTracker還沒啟動,因此 http:// pc002:50030/ 網頁無法顯示230 * ps: 然而JobTracker還沒啟動,因此 http://node02:50030/ 網頁無法顯示 227 231 228 232 * bin/start-mapred.sh腳本會參照jobtracker上${HADOOP_CONF_DIR}/slaves文件的內容,在所有列出的slave上啟動tasktracker。 … … 231 235 232 236 {{{ 233 /opt/hadoop$ ssh pc002 "/opt/hadoop/bin/start-mapred.sh"237 /opt/hadoop$ ssh node02 "/opt/hadoop/bin/start-mapred.sh" 234 238 }}} 235 239 236 240 * 啟動之後, jobtracker也正常運作囉! 237 241 ------ 238 * http:// pc002:50030/ - Hadoop 管理介面242 * http://node02:50030/ - Hadoop 管理介面 239 243 * [[Image(job.png)]] 240 244 ------