|| 說明 || 路徑 || 擁有者身份 ||
|| nutchez 家目錄 || /opt/nutchez/ || nutchuser ||
|| nutch 家目錄 || /opt/nutchez/nutch || nutchuser ||
|| nutch 工作目錄 || /var/nutchez/nutch-nutchuser || nutchuser ||
|| nutch 日誌檔 || /var/nutchez/logs || nutchuser ||
|| nutch 設定檔 || /opt/nutchez/nutch/conf || nutchuser ||
|| tomcat 家目錄 || /opt/nutchez/tomcat || nutchuser ||
|| nutchez 使用者目錄 || /home/nutchuser/nutchez/ || nutchuser ||
|| nutchez 索引資料庫 || /home/nutchuser/nutchez/search/ || 由nutch完成crawl後產生 ||
* 修改 /opt/nutchez/nutch/conf/ 的 hadoop-site.xml
{{{
#!xml
fs.default.name
hdfs://secuse.nchc.org.tw:9000
mapred.job.tracker
secuse.nchc.org.tw:9001
hadoop.tmp.dir
/var/nutchez/nutch-nutchuser
}}}
* 改tomcat port => /opt/nutchez/tomcat/conf/ 的 server.xml
{{{
#!xml
}}}
* 最後的搜尋結果 => /opt/nutchez/tomcat/webapps/ROOT/WEB-INF/classes/ 的 nutch-site.xml
{{{
#!xml
searcher.dir
/home/nutchuser/nutchez/search
}}}
* /opt/nutchez/nutch/bin/nutch 執行檔有改
{{{
#!sh
NUTCH_HOME=/opt/nutchez/nutch
NUTCH_CONF_DIR=/opt/nutchez/nutch/conf
NUTCH_LOG_DIR=/var/nutchez/logs
}}}
* 用 改版的 nutchez 的 hadoop 還是要format 與 start-all.sh