wiki:waue/2010/nutchez2_archi

Version 16 (modified by rock, 14 years ago) (diff)

--

  • 安裝目錄說明
說明 路徑 擁有者身份
nutchez 家目錄 /opt/nutchez/ nutchuser
nutch 家目錄 /opt/nutchez/nutch nutchuser
nutch 工作目錄 /var/nutchez/nutch-nutchuser nutchuser
nutch 日誌檔 /var/nutchez/logs nutchuser
nutch 設定檔 /opt/nutchez/nutch/conf nutchuser
tomcat 家目錄 /opt/nutchez/tomcat nutchuser
nutchez 使用者目錄 /home/nutchuser/nutchez/ nutchuser
搜尋入口網址 /home/nutchuser/nutchez/urls/urls.txt
nutchez 索引資料庫 /home/nutchuser/nutchez/search/ 由nutch完成crawl後產生
  • 安裝 shell 檔

- install.sh 安裝程序
- remove.sh 移除 nutchez
- nutchez Nutchez 設定
| - cluster_setup 設置 datanode 與 tasktracker 節點 /opt/nutchez/nutch/bin/hadoop-daemon.sh start datanode
/opt/nutchez/nutch/bin/hadoop-daemon.sh start tasktracker
| - tomcat_switch 網站伺服器開關 /opt/nutchez/tomcat/bin/startup.sh
/opt/nutchez/tomcat/bin/shutdown.sh
| - tomcat_port 網站伺服器換port 修改 /opt/nutchez/tomcat/conf/server.xml
| - lang_switch 語言選擇
  • 網頁管理檔

admin.jsp 管理介面
| - login.jsp 帳號登入
| - crawl.jsp 抓取設定
| - statistics.jsp 搜尋資料庫統計資料
| - cluster_status.jsp hadoop叢集狀態