Changes between Version 29 and Version 30 of waue
- Timestamp:
- Jun 6, 2008, 1:33:52 PM (16 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
waue
v29 v30 7 7 * [Planing][has not yet started] nutch 應用範例 -> 索引硬碟資料 8 8 == 工作日誌 == 9 === 6/6 === 10 11 [wiki:hadoop_hbase_sample2 map-reduce with hbase sample code] 已解決之前的問題 12 * 程式說明 :將檔案中的資料用map-reduce方式餵入hbase 13 14 * 解決方法: 15 由於檔案讀取時是以行為單位,因此大部分的sample code一行能parser的檔案一行只有兩個欄位,前面的欄位當key,後面的欄位當value,但我想並不是所有的應用都兩個欄位就可以,因此設計一parse三個欄位的程式。也因如此,從程式當中的取出的原始資料流為byte[] 格式,為了利用split()函數切割欄位的值需要把byte[]轉string ,parse 完後再將string 轉回byte[]。錯誤的關鍵在於,當byte[]轉string時用 Byte.toSring()函數,但後來測試發現此函數轉出來的皆為亂碼,亂碼在配合split()就會出現run time error了。故換成 String str = new String(byte);則可以轉出正常,之後string轉回byte則用String.getByte()即可。 16 17 === 6/5 === 18 參觀電腦展 9 19 === 6/4 === 10 20 試寫一 [wiki:hadoop_hbase_error_sample2 map-reduce with hbase sample code] 但有錯誤