wiki:waue/2011/0927

原本架構:

  • crawlzilla-package.tar.gz
  • carwlzilla-install.tar.gz

舊的安裝與更新方法是,下載 crawlzilla-package.tar.gz (140M)下來更新,然而一旦修改此 package 檔,則需要重新上傳,造成伺服器與更新時間太頻繁。

新架構希望能達到以下目的

  • 方便更新到 sourceforge.net
  • 更新較頻繁的檔可以越小越好

目前架構:

nutch-1.2-tomcat-6.0-BaseLite?-p0.tar.gz 原本的 apache-nutch-1.2 與 apache-tomcat-6.0 但刪除 doc/, src/, .job, .jar 54.0 M
nutch-1.2-IKAnalyzer-p0.tar.gz 放入 中文分詞後更改的 .jar, .job 與 IKAnalyzer.lib 49.7 M
nutch-1.2-WebDefault?-p0.tar.gz 修改過得 nutch 的搜尋網頁介面:tomcat/webapps/default/ 36.4M
carwlzilla-install.tar.gz 含有 crawlzilla 的 main, war, ; 針對 {conf/ , bin/} 的 nutch-patch , tomcat-patch 0923版= 9.5M
Last modified 13 years ago Last modified on Sep 27, 2011, 6:03:48 PM