{{{ #!html
NutchEz : 讓你更輕鬆自在的玩 Nutch
}}} [[PageOutline]] = 簡介 = * Nutch 是目前最知名也是最好的opensource 搜尋引擎專案之一,想製作自己的客製化搜尋引擎? 用Nutch就對了![http://nutch.sourceforge.net/docs/zh/ Nutch簡介] * 不過Nutch的設定繁瑣,加上還要搭配Tomcat,在入手前需要花不少時間研究如何安裝使用 * 所以就把Nutch要用到的東西化繁為簡,打包成一個deb檔讓大家使用,目前先名為NutchEz * !NutchEz 顧名思義就是Nutch Easy,只要安裝NutchEz後就,再加上幾個指令,就可以輕鬆的產生出你自己的搜尋引擎囉! * 現在下載的檔案還是叫做nutch,等之後調整較多並加入ui再改名 = 安裝方法 = * 下載 [http://hadoop.nchc.org.tw/~waue/nutch_1.0-1_i386.deb NutchEz 的deb檔] * 滑鼠點兩下安裝 = 使用方法 = {{{ $ sudo su - # cd /opt/nutch }}} * 輸入或修改你要爬取的網址 {{{ # vim urls/urls.txt }}} * 開始爬取 {{{ # bin/nutch crawl urls -dir search -depth 4 -topN 50 # tomcat/bin/startup.sh }}} * OK ! 你可以到 [http://localhost:8080] 看你的成果囉 = 預覽 = [[Image(1.png)]] [[Image(2.png)]] = Future Work = * 加入Dialog 及流程設計 = 參考 = * [wiki:jazz/Hadoop_deb Jazz的deb打包教學] * [wiki:waue/2009/0512 如何製作Nutch deb]