[[PageOutline]] = 實作一 = == 安裝 Hadoop4Win == * STEP 1 : 首先[http://sourceforge.net/projects/hadoop4win/files/0.1.3/hadoop4win-setup-full_0.1.3.zip/download 下載 hadoop4win 任一版本],並存至硬碟(如 D:)。使用 Windows XP 以上版本內建的解壓縮工具將 zip 壓縮檔解開。 * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_01.jpg,width=600)]][[BR]] * STEP 2 : 在 hadoop4win-setup 目錄中,執行 hadoop4win-setup.bat 批次檔。 * 註:預設將安裝到 C:/hadoop4win 中,若因硬碟存取權限較嚴格,需修改安裝路徑,請自行修改 hadoop4win-setup.bat。 * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_02.jpg,width=600)]] * STEP 3 : 一開始會出現 Cygwin 的安裝畫面,按『下一步(N)』開始安裝。 * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_03.jpg,width=600)]] * 接著批次程式將會把 Hadoop 單機版所需之 Java 開發環境 (JDK 1.6.0 update 18)、 Hadoop 0.20.2 與 HBase 0.20.4 壓縮檔拷貝至安裝目錄。若您下載的是網路安裝版本,會看到批次檔先從網路上下載三個壓縮檔,才開始安裝。 * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_04.jpg,width=600)]] * 程式會自動執行 JDK 與 Hadoop 的安裝。 * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_06.jpg,width=600)]] * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_07.jpg,width=600)]] * 並且幫您自動執行 Hadoop Namenode 的格式化 * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_08.jpg,width=600)]] * 隨即依序啟動 Hadoop Name Node, Data Node, Job Tracker, Task Tracker * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_09.jpg,width=600)]] * 並使用預設瀏覽器依序開啟 http://localhost:50030 與 http://localhost:50070 (若使用 IE 可能會只看到一個畫面,Firefox 則會看到兩個分頁) * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_10.jpg,width=600)]] * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_11.jpg,width=600)]] * 最後會解壓縮 HBase,並進行單機版 HBase 的設定,當完成 HBase 安裝後,您會看到以下的畫面。 * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_19.jpg,width=600)]] * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_20.jpg,width=600)]] [[PageOutline]] == 練習 HDFS 指令 == * STEP 4 : 此時系統已完成 Hadoop 0.20.2 的 tar ball 安裝,目前將 Hadoop 安裝於 /opt/hadoop 路徑下,故使用者必須先切換至該目錄才能進行相關指令操作。 {{{ $ cd /opt/hadoop }}} * STEP 5 : 練習 HDFS 指令: 『__'''bin/hadoop fs -put '''__』 {{{ $ bin/hadoop fs -put conf-org input }}} * [[Image(wiki:Hadoop4Win:hadoop4win_12.jpg,width=600)]] * STEP 6 : 練習 HDFS 指令: 『__'''bin/hadoop fs -lsr '''__』 {{{ $ bin/hadoop fs -lsr }}} * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_13.jpg,width=600)]] * STEP 7 : 練習 HDFS 指令: 『__'''bin/hadoop fs -get '''__』, [[PageOutline]] * STEP 8 : 練習從 http://localhost:50070 查看目前 HDFS 的檔案分佈狀況 == 練習執行 MapReduce 範例 == * STEP 9 : 練習 MapReduce 丟 Job 指令: 『__'''bin/hadoop jar '''__』 {{{ $ bin/hadoop jar hadoop-*-examples.jar wordcount input output }}} * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_14.jpg,width=600)]] * STEP 10 : 練習從 http://localhost:50030 查看目前 MapReduce Job 的運作情形 * [[BR]][[Image(wiki:Hadoop4Win:hadoop4win_15.jpg,width=600)]]