Changes between Version 1 and Version 2 of waue/2009/0407
- Timestamp:
- Apr 7, 2009, 6:14:17 PM (16 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
waue/2009/0407
v1 v2 1 1 * 今天要來研究如何把nutch加入到已經在運作的hadoop上 2 * 續昨天,目錄結構如下 3 4 || /opt/nutch || nutch 家目錄|| 5 || /opt/nutch_conf || nutch設定檔 || 6 || /opt/hadoop || hadoop家目錄 || 7 || /opt/conf || hadoop設定檔 || 8 || /tmp/ || 日誌檔、中間檔與暫存檔 || 9 2 10 * 有可能的原因是nutch付的hadoop (0.19.1) 與我目前環境的hadoop (0.18.3)版本不同 3 11 * 由於大部分的情況是,我已經安裝了hadoop平台並且讓他工作一段時間之後,才要來加入nutch的測試,因此不可能在把以前的東西都刪掉,只為了測試nutch... 12 * 目前用[http://wiki.apache.org/nutch/Upgrading_Hadoop nutch官方文件]所提供的概念,把nutch內的hadoop都替換為原本主機已經運行的hadoop,設定檔要設定對,並且注意把hadoop-env.sh的export參數都寫入bash.bashrc內,這麼做可以正確執行。 13 14 {{{ 15 $ cp -rf /opt/hadoop/* /opt/nutch/ 16 $ vim /opt/nutch_conf/slaves 17 $ vim /opt/nutch_conf/nutch-site.xml 18 $ vim /opt/nutch_conf/hadoop-site.xml 19 $ scp -rc /opt/nutch_conf dx7200:/opt/nutch_conf 20 $ scp -rc /opt/nutch dx7200:/opt/nutch 21 }}} 22 23 * 其他大致如昨天,但發現其實收尋的能力有限,幾乎只有到一層,需要解決搜尋能力的問題