close
Warning:
Can't synchronize with repository "(default)" (Unsupported version control system "svn": /usr/lib/python2.7/dist-packages/libsvn/_fs.so: failed to map segment from shared object: Cannot allocate memory). Look in the Trac log for more information.
- Timestamp:
-
May 18, 2010, 12:13:11 PM (16 years ago)
- Author:
-
waue
- Comment:
-
--
Legend:
- Unmodified
- Added
- Removed
- Modified
-
|
v2
|
v3
|
|
| 9 | 9 | [[PageOutline]] |
| 10 | 10 | |
| 11 | | = 前言 = |
| 12 | | == 說明 == |
| 13 | | == 缺點 == |
| 14 | | = 目的 = |
| | 11 | = 說明 = |
| 15 | 12 | |
| 16 | | = 動機 = |
| | 13 | * Nutch 是目前最知名也是最好的opensource 搜尋引擎專案之一,想製作自己的客製化搜尋引擎? 用Nutch就對了! |
| | 14 | * 但是Nutch的設定繁瑣,因此我們之前試著開發 NutchEz 來幫助簡化安裝、設定以及操作的步驟 |
| | 15 | * NutchEz 顧名思義就是Nutch Easy,只要安裝NutchEz後就,再加上幾個指令,就可以輕鬆的產生出你自己的搜尋引擎囉! |
| | 16 | * 目前正開始第二版本的NutchEz v0.2 ,希望能開發出功能更強,選項更多,但操作更人性化的專案 |
| | 17 | |
| | 18 | = 適用於 = |
| | 19 | |
| | 20 | == 第一版本NutchEz 說明 == |
| | 21 | * NutchEz V 0.1 的特色 |
| | 22 | * 專為 debian 系統開發,因此打包成 deb 檔,使用者只要點兩下即可安裝 |
| | 23 | * 已整合所有需要用到的套件 (Nutch + Hadoop + Tomcat),並調整過中文支援設定 |
| | 24 | * 使用 linux 的 dialog (cdialog) 介面,好處是開發容易,並且遠端登入的使用者也能使用此圖形介面 |
| | 25 | * 步驟簡單,大約五個步驟,完成前有設定參數確認頁,確認系統即開始建構搜尋引擎 |
| | 26 | * 連結 |
| | 27 | * [http://trac.nchc.org.tw/cloud/wiki/NutchEz nutchez 第一版本的說明網站 ] |
| | 28 | * [http://trac.nchc.org.tw/cloud/attachment/wiki/NutchEz/1.png 第一版本的截圖] |
| | 29 | |
| | 30 | == 第二版本NutchEz 的新增功能 == |
| | 31 | |
| | 32 | === 網頁管理 === |
| | 33 | * 網頁管理介面,提供更多選項、更完整的資訊,並可遠端操作 |
| | 34 | === 簡易安裝 === |
| | 35 | * 安裝設定利用 dialog ,簡單又可遠端操作 |
| | 36 | === 支援叢集運算 === |
| | 37 | * 支援在叢集上透過平行分散式方法抓取分析網頁 |
| | 38 | === 適用汎 Linux 平台 === |
| | 39 | * 支援多種 Linux Distribution |
| | 40 | === 多種語言 === |
| | 41 | * 介面支援多國語言 |
| | 42 | === 中文最佳化 === |
| | 43 | * 增加中文分詞 |
| | 44 | * 解決中文亂碼 |
| | 45 | === 修正部份 bug === |
| | 46 | * 包括 Nutch or NutchEz v0.1 |
| 17 | 47 | |
| 18 | 48 | = 開會內容 = |
| 19 | 49 | |
| 20 | | == [wiki:waue/2010/0430 1st] == |
| | 50 | * [http://trac.nchc.org.tw/cloud/wiki/nutchez2_talk archive] |
| 21 | 51 | |
| 22 | | || waue || * read nutch -> by lucene reader : luke [[br]] * 系統架構圖 [[br]] * 企劃書 [[br]] * 專案規劃&系統分析 [[br]] * nutch cluster howto |
| 23 | | || fafa || * how to install hadoop cluster easily ! || |
| 24 | | |
| 25 | | == [wiki:waue/2010/0507 2st] == |
| 26 | | * 決議 |
| 27 | | * 建立統一的使用者名稱 :nutchuser |
| 28 | | |
| 29 | | || waue || 提供nutch資訊[[br]]研究tomcat權限問題 || linux 版本描述檔為 /etc/lsb-release || |
| 30 | | || shunfa || 規劃安裝流程 || || |
| 31 | | |
| 32 | | == 3st == |
| | 52 | == 3st (5/17) == |
| 33 | 53 | * 討論事項 |
| 34 | 54 | * 圖形介面 |
| … |
… |
|
| 43 | 63 | || rock || 實做 check_root.sh 主邏輯 || || |
| 44 | 64 | |
| 45 | | = 改進事項 = |
| 46 | | |
| 47 | | * 支援叢集 |
| 48 | | * 圖形介面 | 網頁管理 |
| 49 | | * 通用:各種linux版本皆可 |
| 50 | | * 搜尋內容:中文支援與分詞 |
| 51 | | * bug |
| 52 | | |
| | 65 | == 4st (5/21) == |
| | 66 | * 討論事項 |
| | 67 | |
| 53 | 68 | = [wiki:waue/2010/nutchez2_archi 系統架構(編輯)] = |
| 54 | 69 | |
| … |
… |
|
| 72 | 87 | * Iframe - 網頁鑲嵌其他網頁,用以整合cluster資訊 |
| 73 | 88 | |
| 74 | | * [http://trac.nchc.org.tw/cloud/wiki/NutchEz nutchez 的說明網站 ] |
| | 89 | |
| 75 | 90 | * [http://code.google.com/p/nutchez/ nutchez 的 google code site 專案 ] |
| 76 | 91 | * [wiki:waue/2010/0430 賽程資訊] |