| 50 | |
| 51 | = 作業 Homework = |
| 52 | |
| 53 | * 題目:請嘗試將 [wiki:NCTU110329/Lab6 實作六] 的 WordCount2.java 改成逆向索引(Reverse Index) ReverseIndex.java。使 ReverseIndex 執行之結果為「"關鍵字"\t"檔案名稱(用逗點隔開)"」型態。以實作六最後的執行方法,忽略句點(\.)與逗點(\,),並且忽略大小寫(case.sensitive=false),結果應該為: |
| 54 | {{{ |
| 55 | and input2 |
| 56 | cloud input1,input2 |
| 57 | course input1,input2,input2 |
| 58 | enjoy input2 |
| 59 | i input1,input2 |
| 60 | like input1,input2 |
| 61 | nctu input1,input2 |
| 62 | this input2 |
| 63 | we input2 |
| 64 | }}} |
| 65 | * 參考步驟: |
| 66 | {{{ |
| 67 | $ wget http://hadoop.nchc.org.tw/WordCount2.java -O ReverseIndex.java |
| 68 | $ vi ReverseIndex.java #### DO YOUR MODIFICATION - 修改對應的程式碼 |
| 69 | $ mkdir -p MyJava3 |
| 70 | $ javac -classpath hadoop-core.jar -d MyJava3 ReverseIndex.java |
| 71 | $ hadoop jar reverseindex.jar ReverseIndex -Dwordcount.case.sensitive=false lab6_input lab6_out4 -skip pattern.txt |
| 72 | }}} |
| 73 | * 繳交期限:2011年5月3日(二) 上午 11:59 |
| 74 | * 繳交方式:將原始碼與報告以附件方式寄至 jazz _AT_ nchc _DOT_ org _DOT_ tw (1) 程式原始碼一份:以 ${學號}.zip 方式壓縮與命名 (2) 報告一份:以 ${學號}.doc 命名。 |
| 75 | * 提示: |
| 76 | * 請將 Mapper 輸出、Reducer 輸入輸出的 (Key,Value) 由原本的 (Text,IntWritable) 改成 (Text, Text) |