Version 1 (modified by waue, 15 years ago) (diff) |
---|
範例六:WordCountHBase
說明:
此程式碼將輸入路徑的檔案內的字串取出做字數統計,再將結果塞回HTable內
結果:
$ hbase shell > scan 'wordcount' ROW COLUMN+CELL am column=content:count, timestamp=1264406245488, value=1 chen column=content:count, timestamp=1264406245488, value=1 hi, column=content:count, timestamp=1264406245488, value=2 ......(略)
注意:
- 在hdfs 上來源檔案的路徑為 "/user/$YOUR_NAME/input"
請注意必須先放資料到此hdfs上的資料夾內,且此資料夾內只能放檔案,不可再放資料夾
- 運算完後,程式將執行結果放在hbase的wordcount資料表內
參考:
1.程式碼改編於: http://blog.ring.idv.tw/comment.ser?i=337
2.hbase 運作 mapreduce 程式的方法參考於:http://wiki.apache.org/hadoop/Hbase/MapReduce