Changes between Version 11 and Version 12 of NCTU110329
- Timestamp:
- Apr 25, 2011, 5:54:22 PM (14 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
NCTU110329
v11 v12 51 51 = 作業 Homework = 52 52 53 * 題目:請嘗試將 [wiki:NCTU110329/Lab6 實作六] 的 WordCount2.java 改成逆向索引(Reverse Index) ReverseIndex.java。使 ReverseIndex 執行之結果為「"關鍵字"\t"檔案名稱(用逗點隔開)"」型態。以實作六最後的執行方法,忽略句點(\.)與逗點(\,),並且忽略大小寫(case.sensitive=false),結果應該為: 53 * 題目:請嘗試將 [wiki:NCTU110329/Lab6 實作六] 的 WordCount2.java 改成逆向索引(Reverse Index) !ReverseIndex.java。使 !ReverseIndex 執行之結果為「"關鍵字"\t"檔案名稱(用逗點隔開)"」型態。以實作六最後的執行方法,忽略句點(\.)與逗點(\,),並且忽略大小寫(case.sensitive=false), 54 * Please try to modified WordCount2.java download from [wiki:NCTU110329/Lab6 Lab6], rename it to !ReverseIndex.java. Let ReverseIndex output as "Keyword <TAB> filename(separated by comma)". Try to run it by ignoring "\." and "\," pattern and case-insensitive. 55 * 結果應該為:[[BR]]The result should be as following: 54 56 {{{ 55 57 and input2 … … 63 65 we input2 64 66 }}} 65 * 參考步驟: 67 * 參考步驟:[[BR]]Here is the reference steps: 66 68 {{{ 67 69 $ wget http://hadoop.nchc.org.tw/WordCount2.java -O ReverseIndex.java … … 72 74 }}} 73 75 * 繳交期限:2011年5月3日(二) 上午 11:59 74 * 繳交方式:將原始碼與報告以附件方式寄至 jazz _AT_ nchc _DOT_ org _DOT_ tw (1) 程式原始碼一份:以 ${學號}.zip 方式壓縮與命名 (2) 報告一份:以 ${學號}.doc 命名。 75 * 提示: 76 * 請將 Mapper 輸出、Reducer 輸入輸出的 (Key,Value) 由原本的 (Text,IntWritable) 改成 (Text, Text) 76 * Due date: 11:59 AM, Tuesday, May 3th, Year 2011 77 * 繳交方式:將原始碼與報告以附件方式寄至 jazz _AT_ nchc _DOT_ org _DOT_ tw (1) 程式原始碼一份:以 ${學號}.zip 方式壓縮與命名 (2) 報告一份:以 ${學號} 命名。 78 * Please e-mail the java source code and report (doc or PDF) to jazz _AT_ nchc _DOT_ org _DOT_ tw 79 * 提示:[[BR]]Hint: 80 * 請將 Mapper 輸出、Reducer 輸入輸出的 (Key,Value) 由原本的 (Text, !IntWritable) 改成 (Text, Text) 81 * Replace (Key,Value) pair from (Text, !IntWritable) to (Text, Text)