wiki:TMUE110317/Lab1

Version 7 (modified by jazz, 14 years ago) (diff)

--

實作一

安裝 Hadoop4Win

  • STEP 1 : 首先下載 hadoop4win 任一版本,並存至硬碟(如 D:)。使用 Windows XP 以上版本內建的解壓縮工具將 zip 壓縮檔解開。


  • STEP 2 : 在 hadoop4win-setup 目錄中,執行 hadoop4win-setup.bat 批次檔。
    • 註:預設將安裝到 C:/hadoop4win 中,若因硬碟存取權限較嚴格,需修改安裝路徑,請自行修改 hadoop4win-setup.bat。

  • STEP 3 : 一開始會出現 Cygwin 的安裝畫面,按『下一步(N)』開始安裝。

  • 接著批次程式將會把 Hadoop 單機版所需之 Java 開發環境 (JDK 1.6.0 update 18)、 Hadoop 0.20.2 與 HBase 0.20.4 壓縮檔拷貝至安裝目錄。若您下載的是網路安裝版本,會看到批次檔先從網路上下載三個壓縮檔,才開始安裝。

  • 程式會自動執行 JDK 與 Hadoop 的安裝。


  • 並且幫您自動執行 Hadoop Namenode 的格式化

  • 隨即依序啟動 Hadoop Name Node, Data Node, Job Tracker, Task Tracker

  • 最後會解壓縮 HBase,並進行單機版 HBase 的設定,當完成 HBase 安裝後,您會看到以下的畫面。


練習 HDFS 指令

  • STEP 4 : 此時系統已完成 Hadoop 0.20.2 的 tar ball 安裝,目前將 Hadoop 安裝於 /opt/hadoop 路徑下,故使用者必須先切換至該目錄才能進行相關指令操作。
    $ cd /opt/hadoop
    
  • STEP 5 : 練習 HDFS 指令: 『bin/hadoop fs -put <local file/dir> <HDFS file/dir>
    $ bin/hadoop fs -put conf-org input
    
  • STEP 6 : 練習 HDFS 指令: 『bin/hadoop fs -lsr <HDFS file/dir>
    $ bin/hadoop fs -lsr
    

  • STEP 7 : 練習 HDFS 指令: 『bin/hadoop fs -get <HDFS file/dir> <local file/dir>』,

練習執行 MapReduce 範例

  • STEP 9 : 練習 MapReduce 丟 Job 指令: 『bin/hadoop jar <local jar file> <class name> <parameters>
    $ bin/hadoop jar hadoop-*-examples.jar wordcount input output