Version 33 (modified by jazz, 14 years ago) (diff) |
---|
NutchEz V2 開發者網頁
國網中心自由軟體實驗室
一、討論內容
之前討論歸檔
6st (6/4)
- 流程演練與討論
- 報名 & 企劃書 修改
- nutchez 叢集總管介面 開發討論
- nutchez web管理頁面 開發討論
需修改部份
Install.sh 1. IP 沒有被紀錄 2. 預設安裝 gij 的問題 3. nutchez 的 tar.gz 包修正 4. 將 自己的 hostname & ip 紀錄到 nutch_nodes 5. ssh-add /home/nutchuser/.ssh/id_rsa 以免ubuntu9.10之後無法登入 Client_Install.sh 1. 預設安裝 gij 的問題 2. ssh-add /home/nutchuser/.ssh/id_rsa 以免ubuntu9.10之後無法登入 3. slave的 /etc/hosts 被填寫兩次 client ip & name 其他: Merge nutch nodes
7st (6/11)
二、系統架構(編輯)
WikiInclude(waue/2010/nutchez2_archi)?
三、各元件流程圖 (編輯)
WikiInclude(waue/2010/nutchez2_procedure)?
四、專案管理
- 第 0 步驟是第一次下載整個專案的時候執行
- 1~3 步驟 是每次要讓專案同步時需要做的
0. 下載專案
- 列出 svn 內有什麼資料夾
svn ls https://trac.nchc.org.tw/svn/cloud/
接著會問一大堆認證密碼什麼鬼的,密碼正確才可以列出檔案
- 下載 nutchez 0.2 的專案
cd /opt/svn_project/ svn co https://trac.nchc.org.tw/svn/cloud/nutchez-0.2
- 如果只是要 check out 原始碼,也可以從 public SVN 的網址下載,就不會問帳號密碼。
svn ls http://trac.nchc.org.tw/pub/cloud/nutchez-0.2
svn co http://trac.nchc.org.tw/pub/cloud/nutchez-0.2
1. 更新專案
cd nutchez-0.2 svn update
2. 加入檔案、資料夾的指令
svn mkdir aaa svn add bbb.txt
3. 專案內容上傳
svn ci
五、時間表
項目 預計 開始 完成 企劃書 5/3~5/4 5/3 5/5 survey 5/3~5/7 5/3 開發 5/10~9/1 試用與除錯 9/1~9/20 專案完成 9/20
六、相關連結
- nutchez v2 的介紹連結
- luke - nutch 的統計頁面
- Iframe - 網頁鑲嵌其他網頁,用以整合cluster資訊
- nutchez 的 google code site 專案
- 賽程資訊
- nutch 詳細安裝
- plugin central
新增目標
- 穿透帳號密碼登入 .. httpclient
- ftp: login 設定
- MS File Share Folder ( samba ) - https://issues.apache.org/jira/browse/NUTCH-427
- 中文分詞介紹 : nutch的中文分詞插件 、nutch的中文分詞初探
Attachments (1)
- mvc.zip (46.8 KB) - added by waue 14 years ago.
Download all attachments as: .zip