Changes between Version 2 and Version 3 of nutchez2


Ignore:
Timestamp:
May 18, 2010, 12:13:11 PM (15 years ago)
Author:
waue
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • nutchez2

    v2 v3  
    99[[PageOutline]]
    1010
    11 = 前言 =
    12 == 說明 ==
    13 == 缺點 ==
    14 = 目的 =
     11= 說明 =
    1512
    16 = 動機 =
     13 * Nutch 是目前最知名也是最好的opensource 搜尋引擎專案之一,想製作自己的客製化搜尋引擎? 用Nutch就對了!
     14 * 但是Nutch的設定繁瑣,因此我們之前試著開發 NutchEz 來幫助簡化安裝、設定以及操作的步驟
     15 * NutchEz 顧名思義就是Nutch Easy,只要安裝NutchEz後就,再加上幾個指令,就可以輕鬆的產生出你自己的搜尋引擎囉!
     16 * 目前正開始第二版本的NutchEz v0.2 ,希望能開發出功能更強,選項更多,但操作更人性化的專案
     17
     18= 適用於 =
     19 
     20== 第一版本NutchEz 說明 ==
     21 * NutchEz V 0.1 的特色
     22   * 專為 debian 系統開發,因此打包成 deb 檔,使用者只要點兩下即可安裝
     23   * 已整合所有需要用到的套件 (Nutch + Hadoop + Tomcat),並調整過中文支援設定
     24   * 使用 linux 的 dialog (cdialog) 介面,好處是開發容易,並且遠端登入的使用者也能使用此圖形介面
     25   * 步驟簡單,大約五個步驟,完成前有設定參數確認頁,確認系統即開始建構搜尋引擎
     26 * 連結
     27   * [http://trac.nchc.org.tw/cloud/wiki/NutchEz nutchez 第一版本的說明網站 ]
     28   * [http://trac.nchc.org.tw/cloud/attachment/wiki/NutchEz/1.png 第一版本的截圖]
     29 
     30== 第二版本NutchEz 的新增功能 ==
     31
     32 === 網頁管理 ===
     33 * 網頁管理介面,提供更多選項、更完整的資訊,並可遠端操作
     34 === 簡易安裝 ===
     35 * 安裝設定利用 dialog ,簡單又可遠端操作
     36 === 支援叢集運算 ===
     37 * 支援在叢集上透過平行分散式方法抓取分析網頁
     38 === 適用汎 Linux 平台 ===
     39 * 支援多種 Linux Distribution
     40 === 多種語言 ===
     41 * 介面支援多國語言
     42 === 中文最佳化 ===
     43 * 增加中文分詞
     44 * 解決中文亂碼
     45 === 修正部份 bug ===
     46 * 包括 Nutch or NutchEz v0.1
    1747
    1848= 開會內容 =
    1949
    20  == [wiki:waue/2010/0430 1st] ==
     50 * [http://trac.nchc.org.tw/cloud/wiki/nutchez2_talk archive]
    2151
    22  || waue  ||  * read nutch ->  by lucene reader : luke [[br]]  * 系統架構圖 [[br]]  * 企劃書 [[br]]   * 專案規劃&系統分析 [[br]]   * nutch cluster howto
    23  || fafa  ||  *  how to install  hadoop cluster easily ! ||
    24 
    25  == [wiki:waue/2010/0507 2st]  ==
    26  * 決議
    27    * 建立統一的使用者名稱 :nutchuser
    28 
    29  || waue || 提供nutch資訊[[br]]研究tomcat權限問題 || linux 版本描述檔為 /etc/lsb-release  ||
    30  || shunfa || 規劃安裝流程  ||   ||
    31 
    32  == 3st  ==
     52 == 3st (5/17) ==
    3353 * 討論事項
    3454   *  圖形介面
     
    4363 || rock || 實做 check_root.sh 主邏輯 ||   ||
    4464
    45 = 改進事項 =
    46 
    47  * 支援叢集
    48  * 圖形介面 |  網頁管理
    49  * 通用:各種linux版本皆可
    50  * 搜尋內容:中文支援與分詞
    51  * bug
    52 
     65 == 4st (5/21) ==
     66 * 討論事項
     67 
    5368 = [wiki:waue/2010/nutchez2_archi 系統架構(編輯)] =
    5469
     
    7287 *  Iframe - 網頁鑲嵌其他網頁,用以整合cluster資訊
    7388
    74  * [http://trac.nchc.org.tw/cloud/wiki/NutchEz nutchez 的說明網站 ]
     89
    7590 * [http://code.google.com/p/nutchez/ nutchez 的 google code site 專案 ]
    7691 * [wiki:waue/2010/0430 賽程資訊]