Changes between Version 10 and Version 11 of NCTU110329


Ignore:
Timestamp:
Apr 25, 2011, 5:44:58 PM (14 years ago)
Author:
jazz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • NCTU110329

    v10 v11  
    2020 || 4/19 || Hands-On || - 雲端運算核心技術二:運用資料探勘技術打造 PaaS [[BR]] - Introduction to MapReduce [[BR]] - MapReduce 程式架構簡介與編譯練習 [[BR]] - MapReduce Programming 101  ||  [raw-attachment:wiki:NCTU110329:part-3.pdf part-3][[BR]][raw-attachment:wiki:NCTU110329:part-4.pdf part-4] || [wiki:NCTU110329/Lab5 實作五][[BR]][wiki:NCTU110329/Lab6 實作六] || [wiki:NCHCCloudCourse100928_2_IDE 使用 Eclipse 開發 Hadoop 程式] ||
    2121
    22 == 補充 ==
     22= 補充資料 =
    2323
    24  * [http://developer.yahoo.com/hadoop/tutorial/module7.html Yahoo! Developer Network - Hadooop Tutorial]
     24 * [http://developer.yahoo.com/hadoop/tutorial/module7.html Yahoo! Developer Network - Hadooop Tutorial] 有介紹如何調整 Hadoop 參數的參考數據
    2525
    2626== Screen ==
     
    4848     * Ctrl + a + Tab        - 在視窗中移動
    4949     * Ctrl + a + Q          - 取消分割
     50
     51= 作業 Homework =
     52
     53 * 題目:請嘗試將 [wiki:NCTU110329/Lab6 實作六] 的 WordCount2.java 改成逆向索引(Reverse Index) ReverseIndex.java。使 ReverseIndex 執行之結果為「"關鍵字"\t"檔案名稱(用逗點隔開)"」型態。以實作六最後的執行方法,忽略句點(\.)與逗點(\,),並且忽略大小寫(case.sensitive=false),結果應該為:
     54{{{
     55and     input2
     56cloud   input1,input2
     57course  input1,input2,input2
     58enjoy   input2
     59i       input1,input2
     60like    input1,input2
     61nctu    input1,input2
     62this    input2
     63we      input2
     64}}}
     65 * 參考步驟:
     66{{{
     67$ wget http://hadoop.nchc.org.tw/WordCount2.java -O ReverseIndex.java
     68$ vi ReverseIndex.java #### DO YOUR MODIFICATION - 修改對應的程式碼
     69$ mkdir -p MyJava3
     70$ javac -classpath hadoop-core.jar -d MyJava3 ReverseIndex.java
     71$ hadoop jar reverseindex.jar ReverseIndex -Dwordcount.case.sensitive=false lab6_input lab6_out4 -skip pattern.txt
     72}}}
     73 * 繳交期限:2011年5月3日(二) 上午 11:59
     74 * 繳交方式:將原始碼與報告以附件方式寄至 jazz _AT_ nchc _DOT_ org _DOT_ tw (1) 程式原始碼一份:以 ${學號}.zip 方式壓縮與命名 (2) 報告一份:以 ${學號}.doc 命名。
     75 * 提示:
     76  * 請將 Mapper 輸出、Reducer 輸入輸出的 (Key,Value) 由原本的 (Text,IntWritable) 改成 (Text, Text)