◢ <實作十六> | <回課程大綱> ▲ | <實作十九> ◣
實作十八 Lab18
增加 Reducer 個數
Job.setNumReduceTasks(N)
請先連線至 nodeN.3du.me , N 為您的報名編號
- 在前兩個範例中,我們可以觀察到預設的 reducer 個數是固定的。那我們是否可以修改 reducer 的個數呢?答案是可行的!
cd ~/hadoop_labs/lab010 ant hadoop fs -rmr input output hadoop fs -put ~/hadoop/conf input hadoop jar WordCount.jar input output hadoop fs -ls output hadoop fs -cat output/part-*
- 關於 Job 的 setNumReduceTasks() 詳見 javadoc
- org.apache.hadoop.mapreduce.Job.setNumReduceTasks(int)
- http://hadoop.apache.org/docs/r1.0.4/api/org/apache/hadoop/mapreduce/Job.html#setNumReduceTasks(int)
- 實際上 lab010 的程式碼與 lab009 的程式碼只差了以下幾行
-
src/WordCount.java
diff -Naur lab009/src/WordCount.java lab010/src/WordCount.java
old new 28 28 job.setReducerClass(IntSumReducer.class); 29 29 job.setOutputKeyClass(Text.class); 30 30 job.setOutputValueClass(IntWritable.class); 31 job.setNumReduceTasks(2); 31 32 FileInputFormat.addInputPath(job, new Path(otherArgs[0])); 32 33 FileOutputFormat.setOutputPath(job, new Path(otherArgs[1])); 33 34 System.exit(job.waitForCompletion(true) ? 0 : 1);
-
實作習題
<問題 1> 請問執行任務時,同時有幾個 Reducer?
(A) 0 (B) 1 (C) 2 (D) 3
<問題 2> 請問執行任務後,最後產生幾個輸出檔?
(A) 0 (B) 1 (C) 2 (D) 3
<問題 3> 若將 Reducer 個數設為 2,而 mapper 輸出的 key 是 {A,B,C,D}, 其中 A < B < C < D。請問,結果會是以下哪一個?
(A) {A, B}, {C, D} (B) {A, B, C}, {D} (C) {A, C}, {B, D} (D) {A, D}, {B, C}
Last modified 9 years ago
Last modified on Feb 1, 2016, 5:29:37 PM