Context Navigation

Changes between Version 3 and Version 4 of NCHCCloudCourse100928_4_EXM2

Timestamp:: Sep 28, 2010, 9:57:13 AM (14 years ago)
Author:: waue
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

NCHCCloudCourse100928_4_EXM2

-                      v3
+                      v4
 [wiki:NCHCCloudCourse100928_4_EXM 上一關 < ] 第二關 [wiki:NCHCCloudCourse100928_4_EXM3 > 下一關]
+ = 說明 =
+ * HelloHadoopV2
+{{{
+#!text
+        HelloHadoopV2
+        說明：
+                此程式碼比HelloHadoop 增加
+                * 檢查輸出資料夾是否存在並刪除
+                * input 資料夾內的資料若大於兩個，則資料不會被覆蓋
+                * map 與 reduce 拆開以利程式再利用
+        測試方法：
+                將此程式運作在hadoop 0.20 平台上，執行：
+                ---------------------------
+                hadoop jar HelloHadoopV2.jar
+                ---------------------------
+        注意：
+.      在hdfs 上來源檔案的路徑為 "/user/$YOUR_NAME/input"
+                請注意必須先放資料到此hdfs上的資料夾內，且此資料夾內只能放檔案，不可再放資料夾
+.      運算完後，程式將執行結果放在hdfs 的輸出路徑為 "/user/$YOUR_NAME/output-hh2"
+}}}
+ * 請注意以下有三個java檔案，並先compile !HelloMapperV2, !HelloReducerV2, 最後再編譯 !HelloHadoopV2.java
+ =  !HelloMapperV2.java =
+{{{
+#!java
+package org.nchc.hadoop;
+import java.io.IOException;
+import org.apache.hadoop.io.LongWritable;
+import org.apache.hadoop.io.Text;
+import org.apache.hadoop.mapreduce.Mapper;
+public class HelloMapperV2 extends Mapper<LongWritable, Text, Text, Text> {
+        public void map(LongWritable key, Text value, Context context)
+                        throws IOException, InterruptedException {
+                context.write(new Text(key.toString()), value);
+        }
+}
+}}}
+ =  !HelloReducerV2.java =
+{{{
+#!java
+package org.nchc.hadoop;
+import java.io.IOException;
+import org.apache.hadoop.io.Text;
+import org.apache.hadoop.mapreduce.Reducer;
+public class HelloReducerV2 extends Reducer<Text, Text, Text, Text> {
+        public void reduce(Text key, Iterable<Text> values, Context context)
+                        throws IOException, InterruptedException {
+                String str = new String("");
+                Text final_key = new Text();
+                Text final_value = new Text();
+                // 將key值相同的values，透過 && 符號分隔之
+                for (Text tmp : values) {
+                        str += tmp.toString() + " &&";
+                }
+                final_key.set(key);
+                final_value.set(str);
+                context.write(final_key, final_value);
+        }
+}
+}}}
+ = !HelloHadoopV2.java =
 {{{
 #!java
 …
 import org.apache.hadoop.mapreduce.Job;
 import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
+import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
+//      HelloHadoopV2
+//      說明：
+//              此程式碼比HelloHadoop 增加
+//              * 檢查輸出資料夾是否存在並刪除
+//              * input 資料夾內的資料若大於兩個，則資料不會被覆蓋
+//              * map 與 reduce 拆開以利程式再利用
+//
+//      測試方法：
+//              將此程式運作在hadoop 0.20 平台上，執行：
+//              ---------------------------
+//              hadoop jar HelloHadoopV2.jar
+//              ---------------------------
+//
+//      注意：
+//      1.      在hdfs 上來源檔案的路徑為 "/user/$YOUR_NAME/input"
+//              請注意必須先放資料到此hdfs上的資料夾內，且此資料夾內只能放檔案，不可再放資料夾
+//      2.      運算完後，程式將執行結果放在hdfs 的輸出路徑為 "/user/$YOUR_NAME/output-hh2"
+//
+import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
 public class HelloHadoopV2 {
 …
 }}}
- * HelloMapperV2
-{{{
-#!java
-package org.nchc.hadoop;
-import java.io.IOException;
-import org.apache.hadoop.io.LongWritable;
-import org.apache.hadoop.io.Text;
-import org.apache.hadoop.mapreduce.Mapper;
-public class HelloMapperV2 extends Mapper<LongWritable, Text, Text, Text> {
-        public void map(LongWritable key, Text value, Context context)
-                        throws IOException, InterruptedException {
-                context.write(new Text(key.toString()), value);
+        }
+}
-}}}
- * HelloReducerV2
-{{{
-#!java
-package org.nchc.hadoop;
-import java.io.IOException;
-import org.apache.hadoop.io.Text;
-import org.apache.hadoop.mapreduce.Reducer;
-public class HelloReducerV2 extends Reducer<Text, Text, Text, Text> {
-        public void reduce(Text key, Iterable<Text> values, Context context)
-                        throws IOException, InterruptedException {
-                String str = new String("");
-                Text final_key = new Text();
-                Text final_value = new Text();
-                // 將key值相同的values，透過 && 符號分隔之
-                for (Text tmp : values) {
-                        str += tmp.toString() + " &&";
+                }
-                final_key.set(key);
-                final_value.set(str);
-                context.write(final_key, final_value);
+        }
+}
-}}}