Changes between Initial Version and Version 1 of waue/2009/0409


Ignore:
Timestamp:
Apr 9, 2009, 3:15:41 PM (16 years ago)
Author:
waue
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • waue/2009/0409

    v1 v1  
     1[[PageOutline]]
     2
     3{{{
     4#!html
     5<div style="text-align: center;"><big
     6 style="font-weight: bold;"><big><big>Nutch 完整攻略</big></big></big></div>
     7}}}
     8 = Nutch 完整攻略 =
     9
     10 == 前言 ==
     11 * 雖然之前已經測試過了,網路上也有許多人分享過成功的經驗,然而這篇的重點
     12   * 完整的安裝nutch,並解決中文亂碼問題
     13   * 用hadoop的角度來架設nutch
     14   * 搜尋引擎不只是找網頁內的資料,也能爬到網頁內的檔案(如pdf,msword)
     15
     16 == 環境 ==