wiki:waue/2010/0204-06

Version 1 (modified by waue, 14 years ago) (diff)

--

範例六:WordCountHBase

說明:

此程式碼將輸入路徑的檔案內的字串取出做字數統計,再將結果塞回HTable內

結果:

	$ hbase shell
	> scan 'wordcount'
 	ROW		COLUMN+CELL 
	am		column=content:count, timestamp=1264406245488, value=1
  chen	column=content:count, timestamp=1264406245488, value=1 
 	hi,		column=content:count, timestamp=1264406245488, value=2
  ......(略)

注意:

  1. 在hdfs 上來源檔案的路徑為 "/user/$YOUR_NAME/input"

請注意必須先放資料到此hdfs上的資料夾內,且此資料夾內只能放檔案,不可再放資料夾

  1. 運算完後,程式將執行結果放在hbase的wordcount資料表內

參考:

1.程式碼改編於: http://blog.ring.idv.tw/comment.ser?i=337

2.hbase 運作 mapreduce 程式的方法參考於:http://wiki.apache.org/hadoop/Hbase/MapReduce