wiki:nutchez2
close Warning: Can't synchronize with repository "(default)" (Unsupported version control system "svn": /usr/lib/python2.7/dist-packages/libsvn/_repos.so: failed to map segment from shared object: Cannot allocate memory). Look in the Trac log for more information.

Version 3 (modified by waue, 14 years ago) (diff)

--

NutchEz V2
國網中心自由軟體實驗室

說明

  • Nutch 是目前最知名也是最好的opensource 搜尋引擎專案之一,想製作自己的客製化搜尋引擎? 用Nutch就對了!
  • 但是Nutch的設定繁瑣,因此我們之前試著開發 NutchEz 來幫助簡化安裝、設定以及操作的步驟
  • NutchEz 顧名思義就是Nutch Easy,只要安裝NutchEz後就,再加上幾個指令,就可以輕鬆的產生出你自己的搜尋引擎囉!
  • 目前正開始第二版本的NutchEz v0.2 ,希望能開發出功能更強,選項更多,但操作更人性化的專案

適用於

第一版本NutchEz 說明

  • NutchEz V 0.1 的特色
    • 專為 debian 系統開發,因此打包成 deb 檔,使用者只要點兩下即可安裝
    • 已整合所有需要用到的套件 (Nutch + Hadoop + Tomcat),並調整過中文支援設定
    • 使用 linux 的 dialog (cdialog) 介面,好處是開發容易,並且遠端登入的使用者也能使用此圖形介面
    • 步驟簡單,大約五個步驟,完成前有設定參數確認頁,確認系統即開始建構搜尋引擎
  • 連結

第二版本NutchEz 的新增功能

網頁管理

  • 網頁管理介面,提供更多選項、更完整的資訊,並可遠端操作

簡易安裝

  • 安裝設定利用 dialog ,簡單又可遠端操作

支援叢集運算

  • 支援在叢集上透過平行分散式方法抓取分析網頁

適用汎 Linux 平台

  • 支援多種 Linux Distribution

多種語言

  • 介面支援多國語言

中文最佳化

  • 增加中文分詞
  • 解決中文亂碼

修正部份 bug

開會內容

3st (5/17)

  • 討論事項
    • 圖形介面
    • 安裝步驟
    • 簡介系統流程
  • 決議
    • 目前有三個功能要完成: 1. 安裝前制步驟檢查 (check_root.sh) 2. 安裝程式碼(Install.sh)3. 管理網頁(admin.php or admin.jsp)
  • 下次進度
    • 討論方式與svn、程式架構圖、流程設計、時程表
waue survey 網頁管理框架
shunfa 實做Install.sh 主邏輯
rock 實做 check_root.sh 主邏輯

4st (5/21)

  • 討論事項

系統架構(編輯)

WikiInclude(waue/2010/nutchez2_archi)?

各元件流程圖 (編輯)

WikiInclude(waue/2010/nutchez2_procedure)?

時間表

項目 預計 開始 完成
企劃書 5/3~5/4 5/3 5/5
survey 5/3~5/7 5/3
開發 5/10~9/1
試用與除錯 9/1~9/20
專案完成 9/20

其他連結

Attachments (1)

Download all attachments as: .zip