| 1 | = nutch 1.2 的改變 = |
| 2 | |
| 3 | 與nutch 1.0 有許多差異,lucene 的更新,以及索引自庫的關聯方式都不同,try 出以下可能可以完成的方式: |
| 4 | |
| 5 | == 前提 == |
| 6 | |
| 7 | 假設索引自庫已經用 bin/nutch crawl 完 http://www.nchc.org.tw/tw/ 後,下載到local 端,路徑為 ~/kkk 。(因此kkk/ 內有 index, indexes,segments,crawldb,linkdb ) |
| 8 | |
| 9 | tomcat 安裝於 /opt/tomcat/ |
| 10 | |
| 11 | nutch 安裝於 /opt/nutch/ |
| 12 | |
| 13 | 假設創立一個 0311test的搜尋頁面, |
| 14 | |
| 15 | == 步驟 == |
| 16 | |
| 17 | {{{ |
| 18 | /opt/tomcat/bin/catalina.sh stop |
| 19 | mkdir /opt/tomcat/webapps/0311test/ |
| 20 | cp /opt/nutch/nutch-1.2.war /opt/tomcat/webapps/0311test |
| 21 | cd /opt/tomcat/webapps/0311test/ |
| 22 | jar xvf ./nutch-1.2.war |
| 23 | rm nutch-1.2.war; |
| 24 | cp -rf ~/kkk ./crawl |
| 25 | /opt/tomcat/bin/catalina.sh start |
| 26 | }}} |
| 27 | |
| 28 | 官方網站 http://wiki.apache.org/nutch/NutchTutorial說,訣竅在於,當我們執行 /opt/tomcat/bin/catalina.sh start 時,本身所在目錄要有 crawl 這個資料夾,nutch 搜尋才會正確對應到索引自庫。 |
| 29 | |
| 30 | Then visit: http://localhost:8080/0311test |