| 1 | = Crawlzilla 於Ubuntu 10.4下安裝說明 = |
| 2 | |
| 3 | == 安裝環境 == |
| 4 | 執行安裝程式前請確認以下套件是否安裝,以避免相關套件檢查時中斷安裝程序。 |
| 5 | * Sun Java(註:crawlzilla執行環境必須於Sun Java中執行,Ubuntu 10.04換成sun-java-jdk可參考以下指令) |
| 6 | {{{ |
| 7 | sudo add-apt-repository "deb http://archive.canonical.com/ lucid partner" |
| 8 | sudo apt-get update |
| 9 | sudo apt-get install sun-java6-jdk sun-java6-plugin |
| 10 | sudo update-java-alternatives -s java-6-sun |
| 11 | }}} |
| 12 | * openssh及openssh-server |
| 13 | * dialog |
| 14 | |
| 15 | == 安裝步驟 == |
| 16 | |
| 17 | === 單機安裝 === |
| 18 | 此一安裝過程將假設欲安裝crawlzilla單機版於PC1中 |
| 19 | |
| 20 | Step1. 取得安裝檔 |
| 21 | * 於[http://code.google.com/p/nutchez/ GoogleCode]或[https://sourceforge.net/p/crawlzilla/home/ SourceForge]中取得crawlzilla最新安裝檔 |
| 22 | |
| 23 | Step2. 解壓縮並執行安裝程式 |
| 24 | * 參考指令如下: |
| 25 | {{{ |
| 26 | tzr zxvf Crawlzilla-0.2-100813-Shell.tar.gz |
| 27 | ./Crawlzilla_Install/install |
| 28 | }}} |
| 29 | |
| 30 | Step3. 設定密碼及確認網路資訊即可進行安裝 |
| 31 | * 畫面如下: |
| 32 | 圖(1.png here) |
| 33 | |
| 34 | * 待出現"恭喜您完成Crawlzilla安裝,按Enter鍵離開..."即表示單機環境已安裝完成! |
| 35 | * 註:此一步驟將會在系統中新建一組user帳號-crawler,系統服務及叢集間的溝通將會已此一帳號密碼作為執行身份。 |
| 36 | |
| 37 | === 叢集安裝 === |
| 38 | |
| 39 | 此一叢集安裝將於上述之PC1加入叢集運算節點PC2之安裝流程。 |
| 40 | |
| 41 | Step1. 透過PC1取得安裝提示 |
| 42 | * 於client端執行"ssh PC1",並執行 "crawlzilla" 指令,找到"client安裝步驟",如下圖所示: |
| 43 | 圖(2.png here) |
| 44 | |
| 45 | * 相關提示字元範例如下: |
| 46 | {{{ |
| 47 | $ scp crawler@PC1:/home/crawler/crawlzilla/source/client_deploy.sh . |
| 48 | $ ./client_deploy.sh |
| 49 | }}} |
| 50 | |
| 51 | * 由於此一步驟需以crawler的身份ssh至PC1,因此過程中約需輸入1~2次crawler密碼 |
| 52 | |
| 53 | Step2. 於PC2執行上述之提示字元並輸入主機之clawer密碼兩次並確認網路資訊即可自動完成安裝 |
| 54 | 執行畫面如下: |
| 55 | * 確認安裝資訊 |
| 56 | 圖(3.png here) |
| 57 | |
| 58 | * 輸入密碼 |
| 59 | 圖(4.png here) |
| 60 | |
| 61 | * 安裝完成 |
| 62 | 圖(5.png here) |