| 1 | |
| 2 | 原本架構: |
| 3 | |
| 4 | * crawlzilla-package.tar.gz |
| 5 | * carwlzilla-install.tar.gz |
| 6 | |
| 7 | 舊的安裝與更新方法是,下載 crawlzilla-package.tar.gz (140M)下來更新,然而一旦修改此 package 檔,則需要重新上傳,造成伺服器與更新時間太頻繁。 |
| 8 | |
| 9 | 新架構希望能達到以下目的 |
| 10 | |
| 11 | 1. 方便更新到 sourceforge.net |
| 12 | 2. 更新較頻繁的檔可以越小越好 |
| 13 | |
| 14 | 目前想法: |
| 15 | |
| 16 | || nutch-1.2-tomcat-6.0-BaseLite-p0.tar.gz || 原本的 apache-nutch-1.2 與 apache-tomcat-6.0 但刪除 doc/, src/, .job, .jar || 54.0 M || |
| 17 | || nutch-1.2-IKAnalyzer-p0.tar.gz || 放入 中文分詞後更改的 .jar, .job 與 IKAnalyzer.lib || 49.7 M || |
| 18 | || nutch-1.2-WebDefault-p0.tar.gz || 修改過得 nutch 的搜尋網頁介面:tomcat/webapps/default/ || 36.4M || |
| 19 | || carwlzilla-install.tar.gz || 含有 crawlzilla 的 main, war, ; 針對 {conf/ , bin/} 的 nutch-patch , tomcat-patch || 0923版= 9.5M || |