Changes between Initial Version and Version 1 of nutch1.2


Ignore:
Timestamp:
Mar 11, 2011, 7:05:17 PM (13 years ago)
Author:
waue
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • nutch1.2

    v1 v1  
     1= nutch 1.2 的改變 =
     2
     3與nutch 1.0 有許多差異,lucene 的更新,以及索引自庫的關聯方式都不同,try 出以下可能可以完成的方式:
     4
     5== 前提 ==
     6
     7假設索引自庫已經用 bin/nutch crawl 完 http://www.nchc.org.tw/tw/ 後,下載到local 端,路徑為 ~/kkk 。(因此kkk/ 內有 index, indexes,segments,crawldb,linkdb )
     8
     9tomcat 安裝於 /opt/tomcat/
     10
     11nutch 安裝於 /opt/nutch/
     12
     13假設創立一個 0311test的搜尋頁面,
     14
     15== 步驟 ==
     16
     17{{{
     18/opt/tomcat/bin/catalina.sh stop
     19mkdir /opt/tomcat/webapps/0311test/
     20cp /opt/nutch/nutch-1.2.war /opt/tomcat/webapps/0311test
     21cd /opt/tomcat/webapps/0311test/
     22jar xvf ./nutch-1.2.war
     23rm nutch-1.2.war;
     24cp -rf ~/kkk ./crawl
     25/opt/tomcat/bin/catalina.sh start
     26}}}
     27
     28官方網站 http://wiki.apache.org/nutch/NutchTutorial說,訣竅在於,當我們執行 /opt/tomcat/bin/catalina.sh start 時,本身所在目錄要有 crawl 這個資料夾,nutch 搜尋才會正確對應到索引自庫。
     29
     30Then visit: http://localhost:8080/0311test