Changes between Version 14 and Version 15 of NCTU100407


Ignore:
Timestamp:
Apr 29, 2010, 12:17:33 AM (14 years ago)
Author:
jazz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • NCTU100407

    v14 v15  
    2929  * 標準題:因為有多數同學不熟悉 Java 程式語言,因此第一次作業主要以環境安裝、實作練習為主,請各位同學繳交實驗報告一份。(80%)
    3030  * 加分題:以 Cloudera Hadoop VM 那一份待運算的資料,比較 inverse index 在單機虛擬機器的執行時間與在 21 台實驗環境上的執行時間。(20%)
     31  * 提示:開啟 Cloudera Hadoop VM 瀏覽器,選 exercise 的 inverse index,題目說明的最後一行有重要提示。
    3132  * 參考報告格式:
    3233    * 實驗步驟
     
    4041  * 以 hadoop 0.20.2 預設的 conf 目錄為輸入,使用 hadoop fs -put conf input 上傳檔案至 HDFS,請嘗試在 wordcount 範例程式中加入 system.out.println,並回答 map() 函數輸入的 key 內容為何?(20%)
    4142  * 乘上題,根據 wordcount 執行過程,當單機執行時,請問同時有幾個 mapper 被執行?並請參考以下圖形,繪製單機運作時 mapper 與 reducer 運作順序。(20%)
     43    * [[Image(wiki:NCTU100407:wordcount_single_mapred.jpg)]]
    4244  * 將 wordcount 範例移植到國網中心 hadoop.nchc.org.tw 上運行,請問同時有幾個 mapper 被執行?並請參考以下圖形,繪製單機運作時 mapper 與 reducer 運作順序。(20%)
     45    * [[Image(wiki:NCTU100407:wordcount_cluster_mapred.jpg)]]
    4346  * 試根據單機執行與叢集執行的 !JobTracker 網頁( http://localhost:50030 & http://hadoop.nchc.org.tw:50030 )查詢總執行時間,並比較兩者之時間差異。(20%)