1. 安裝流程
1.1 流程解說
- 在 master node 下載 nutchez v0.2.tar.gz 檔,並解開壓縮檔
- 在 master node 執行 master_install 檔進行安裝 (詳細安裝步驟於1.2)
- 安裝成功會產生client_install 的安裝檔
- 在 slave node 上執行此 client_install 安裝檔 (詳細安裝步驟於1.3)
- 所有 slave node 都分別執行了此 client_install 皆正確無誤後,叢集安裝完成
1.2 Master Install 安裝細部流程圖
- Master Install
1.3 Client Install 安裝細部流程圖
- Client Install
2. 管理設定介面
- Nutchez 設定: nutchez
- 設置叢集: cluster_setup
- 設置 datanode 與 tasktracker 節點
- 網頁伺服器開關: tomcat_switch
- 自動開啟關閉tomcat
- 網頁伺服器port 號改變:tomcat_port
- 設置叢集: cluster_setup
3. Nutch 網頁管理介面
- 管理介面 admin.php
- 管理帳號登入: login.php
- 搜尋選項設定與啟動:crawl.php
- 各種nutch 選項、crontab 排班、重新or繼上次搜尋
- 統計資料:statistics.php
- url 有多少列、網頁多少個、資料大小、搜尋工作時間
- 叢集狀態:cluster_status.php
- datanode , tasktracker 狀態
Last modified 14 years ago
Last modified on Jun 28, 2010, 1:38:42 PM
Attachments (1)
- NutchEz_Web_Flow.png (157.7 KB) - added by rock 15 years ago.
Download all attachments as: .zip