{{{ #!html
NutchEz V2 開發者網頁
國網中心自由軟體實驗室
}}} [[PageOutline]] = 一、討論內容 = == [http://trac.nchc.org.tw/cloud/wiki/nutchez2_talk 之前討論歸檔] == == 6st (6/4) == * 流程演練與討論 * 報名 & 企劃書 修改 * nutchez 叢集總管介面 開發討論 * nutchez web管理頁面 開發討論 需修改部份 {{{ Install.sh 1. IP 沒有被紀錄 2. 預設安裝 gij 的問題 3. /etc/hosts 被填寫兩次 client ip & name 4. nutchez 的 tar.gz 包修正 Client_Install.sh 1. 預設安裝 gij 的問題 }}} == 7st (6/11) == = [wiki:waue/2010/nutchez2_archi 二、系統架構(編輯)] = [[WikiInclude(waue/2010/nutchez2_archi)]] = [wiki:waue/2010/nutchez2_procedure 三、各元件流程圖 (編輯)] = [[WikiInclude(waue/2010/nutchez2_procedure)]] = 四、專案管理 = * 第 0 步驟是第一次下載整個專案的時候執行 * 1~3 步驟 是每次要讓專案同步時需要做的 == 0. 下載專案 == * 列出 svn 內有什麼資料夾 {{{ svn ls https://trac.nchc.org.tw/svn/cloud/ }}} 接著會問一大堆認證密碼什麼鬼的,密碼正確才可以列出檔案 * 下載 nutchez 0.2 的專案 {{{ cd /opt/svn_project/ svn co https://trac.nchc.org.tw/svn/cloud/nutchez-0.2 }}} == 1. 更新專案 == {{{ cd nutchez-0.2 svn update }}} == 2. 加入檔案、資料夾的指令 == {{{ svn mkdir aaa svn add bbb.txt }}} == 3. 專案內容上傳 == {{{ svn ci }}} = 五、時間表 = || 項目 || 預計 || 開始 || 完成 || || 企劃書 || 5/3~5/4 || 5/3 || 5/5 || || survey || 5/3~5/7 || 5/3 || || || 開發 || 5/10~9/1 || || || || 試用與除錯 || 9/1~9/20 || || || || 專案完成 || 9/20 || || || = 六、相關連結 = * [wiki:nutchez2_intro nutchez v2 的介紹連結] * luke - [http://www.getopt.org/luke/ nutch 的統計頁面] * Iframe - 網頁鑲嵌其他網頁,用以整合cluster資訊 * [http://code.google.com/p/nutchez/ nutchez 的 google code site 專案 ] * [wiki:waue/2010/0430 賽程資訊] * [wiki:waue/2009/nutch_install nutch 詳細安裝] * [http://wiki.apache.org/nutch/PluginCentral plugin central] = 新增目標 = * 穿透帳號密碼登入 .. [http://wiki.apache.org/nutch/HttpAuthenticationSchemes httpclient] * ftp: [http://zolomon.javaeye.com/blog/378871 login 設定] * MS File Share Folder ( samba ) - [https://issues.apache.org/jira/browse/NUTCH-427] * 中文分詞介紹 : [http://singlerwong.spaces.eepw.com.cn/articles/article/item/30617 nutch的中文分詞插件] 、[http://www.yakergong.com/blog/archives/445 nutch的中文分詞初探]