Changes between Version 2 and Version 3 of nutchez2
- Timestamp:
- May 18, 2010, 12:13:11 PM (15 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
nutchez2
v2 v3 9 9 [[PageOutline]] 10 10 11 = 前言 = 12 == 說明 == 13 == 缺點 == 14 = 目的 = 11 = 說明 = 15 12 16 = 動機 = 13 * Nutch 是目前最知名也是最好的opensource 搜尋引擎專案之一,想製作自己的客製化搜尋引擎? 用Nutch就對了! 14 * 但是Nutch的設定繁瑣,因此我們之前試著開發 NutchEz 來幫助簡化安裝、設定以及操作的步驟 15 * NutchEz 顧名思義就是Nutch Easy,只要安裝NutchEz後就,再加上幾個指令,就可以輕鬆的產生出你自己的搜尋引擎囉! 16 * 目前正開始第二版本的NutchEz v0.2 ,希望能開發出功能更強,選項更多,但操作更人性化的專案 17 18 = 適用於 = 19 20 == 第一版本NutchEz 說明 == 21 * NutchEz V 0.1 的特色 22 * 專為 debian 系統開發,因此打包成 deb 檔,使用者只要點兩下即可安裝 23 * 已整合所有需要用到的套件 (Nutch + Hadoop + Tomcat),並調整過中文支援設定 24 * 使用 linux 的 dialog (cdialog) 介面,好處是開發容易,並且遠端登入的使用者也能使用此圖形介面 25 * 步驟簡單,大約五個步驟,完成前有設定參數確認頁,確認系統即開始建構搜尋引擎 26 * 連結 27 * [http://trac.nchc.org.tw/cloud/wiki/NutchEz nutchez 第一版本的說明網站 ] 28 * [http://trac.nchc.org.tw/cloud/attachment/wiki/NutchEz/1.png 第一版本的截圖] 29 30 == 第二版本NutchEz 的新增功能 == 31 32 === 網頁管理 === 33 * 網頁管理介面,提供更多選項、更完整的資訊,並可遠端操作 34 === 簡易安裝 === 35 * 安裝設定利用 dialog ,簡單又可遠端操作 36 === 支援叢集運算 === 37 * 支援在叢集上透過平行分散式方法抓取分析網頁 38 === 適用汎 Linux 平台 === 39 * 支援多種 Linux Distribution 40 === 多種語言 === 41 * 介面支援多國語言 42 === 中文最佳化 === 43 * 增加中文分詞 44 * 解決中文亂碼 45 === 修正部份 bug === 46 * 包括 Nutch or NutchEz v0.1 17 47 18 48 = 開會內容 = 19 49 20 == [wiki:waue/2010/0430 1st] ==50 * [http://trac.nchc.org.tw/cloud/wiki/nutchez2_talk archive] 21 51 22 || waue || * read nutch -> by lucene reader : luke [[br]] * 系統架構圖 [[br]] * 企劃書 [[br]] * 專案規劃&系統分析 [[br]] * nutch cluster howto 23 || fafa || * how to install hadoop cluster easily ! || 24 25 == [wiki:waue/2010/0507 2st] == 26 * 決議 27 * 建立統一的使用者名稱 :nutchuser 28 29 || waue || 提供nutch資訊[[br]]研究tomcat權限問題 || linux 版本描述檔為 /etc/lsb-release || 30 || shunfa || 規劃安裝流程 || || 31 32 == 3st == 52 == 3st (5/17) == 33 53 * 討論事項 34 54 * 圖形介面 … … 43 63 || rock || 實做 check_root.sh 主邏輯 || || 44 64 45 = 改進事項 = 46 47 * 支援叢集 48 * 圖形介面 | 網頁管理 49 * 通用:各種linux版本皆可 50 * 搜尋內容:中文支援與分詞 51 * bug 52 65 == 4st (5/21) == 66 * 討論事項 67 53 68 = [wiki:waue/2010/nutchez2_archi 系統架構(編輯)] = 54 69 … … 72 87 * Iframe - 網頁鑲嵌其他網頁,用以整合cluster資訊 73 88 74 * [http://trac.nchc.org.tw/cloud/wiki/NutchEz nutchez 的說明網站 ] 89 75 90 * [http://code.google.com/p/nutchez/ nutchez 的 google code site 專案 ] 76 91 * [wiki:waue/2010/0430 賽程資訊]