{{{ #!html
NutchEz : 讓你更輕鬆自在的玩 Nutch
}}} [[PageOutline]] = 簡介 = * Nutch 是目前最知名也是最好的opensource 搜尋引擎專案之一,想製作自己的客製化搜尋引擎? 用Nutch就對了![http://nutch.sourceforge.net/docs/zh/ Nutch簡介] * 不過Nutch的設定繁瑣,加上還要搭配Tomcat,在入手前需要花不少時間研究如何安裝使用 * !NutchEz 顧名思義就是Nutch Easy,只要安裝NutchEz後就,再加上幾個指令,就可以輕鬆的產生出你自己的搜尋引擎囉! = 適用平台 = * Ubuntu or Debian = 安裝方法 = 方法一(圖形介面): * 下載 [http://hadoop.nchc.org.tw/~waue/download.php NutchEz 的deb檔],存於 Ubuntu 桌面上 * 滑鼠點兩下 nutchez_0.1-1_i386.deb 進行安裝 方法二(文字介面): * 在 console 端,執行以下命令: {{{ $ wget http://hadoop.nchc.org.tw/~waue/download.php $ sudo dpkg -i nutchez_0.1-1_i386.deb }}} = 使用方法 = * 1. 輸入指令nutchez {{{ $ nutchez }}} ------ * 2. 輸入或修改你要爬取的網址,一行一個網址 [[Image(1.png)]] ------ * 3. 輸入你搜尋機器人的名字 [[Image(2.png)]] ------ * 4. 輸入你要的收尋深度 (以http://www.nchc.org.tw/tw/為例,當深度為2,就能抓取上千個網址) [[Image(3.png)]] ------ * 5. 輸入你的搜尋網頁所要用的port (當8080 port已被佔用的時候,請輸入其他port) [[Image(4.png)]] ------ * 6. 確認以上輸入的資訊是否正確,正確請按"ok",不正確的話選擇"reset",跳出程式可以選擇"exit" [[Image(5.png)]] ------ * 7. 當前一步驟按了ok後,程式開始執行 [[Image(6.png)]] ------ * 8. 運作完成後,自動開啟瀏覽器到 [http://localhost:8080] [[Image(7.png)]] ------ * 9. Enjoy NutchEz ! [[Image(8.png)]] = 參考 = * [wiki:jazz/Hadoop_deb Jazz的deb打包教學] * [wiki:waue/2009/0512 如何製作Nutch deb]