Changes between Version 7 and Version 8 of waue/2011/0801


Ignore:
Timestamp:
Sep 1, 2011, 1:56:24 PM (13 years ago)
Author:
waue
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • waue/2011/0801

    v7 v8  
    99[[PageOutline]]
    1010
     11= Change Log =
     12 * <update> 20110901 IKAnalyzer3.2.8_waue.jar 重編
    1113= 編譯 =
    1214
     
    7274
    7375 * 下載 IKAnalyzer3.2.8.jar (2011/07/29) 解壓縮
     76   * 此處可以使用官方原始檔來編譯 ,但最後要讓 nutch 頁面索引時索引入的IKAnalyzer 需要修正過,可直接使用我修好的 [http://trac.nchc.org.tw/cloud/attachment/wiki/waue/2011/0801/IKAnalyzer3.2.8_waue.jar IKAnalyzer3.2.8_waue.jar]
    7477[http://code.google.com/p/ik-analyzer/downloads/list]
    7578
     
    137140
    138141
    139 
    140 
    141 
    142142 * 重新編譯 nutch 並產生 nutch-job-1.2.job
    143143
     
    155155= 佈署 =
    156156
    157 分別將 IKAnalyzer3.2.8.jar ; nutch-1.2.jar ; nutch-1.2.job 放到以下目錄
     157分別將 [http://trac.nchc.org.tw/cloud/attachment/wiki/waue/2011/0801/IKAnalyzer3.2.8_waue.jar IKAnalyzer3.2.8-waue.jar(fixed)] ; nutch-1.2.jar ; nutch-1.2.job 放到以下目錄
    158158
    159159 || 目錄  ||  放置檔案 ||
    160  || /opt/crawlzilla/nutch/lib/  || IKAnalyzer3.2.8.jar  ||
     160 || /opt/crawlzilla/nutch/lib/  || IKAnalyzer3.2.8-waue.jar  ||
    161161 || /opt/crawlzilla/nutch  || nutch-1.2.jar [[BR]] nutch-1.2.job  ||
    162  || /opt/crawlzilla/tomcat/webapps/default/WEB-INF/lib/  || IKAnalyzer3.2.8.jar [[BR]] nutch-1.2.jar ||
     162 || /opt/crawlzilla/tomcat/webapps/default/WEB-INF/lib/  || IKAnalyzer3.2.8-waue.jar [[BR]] nutch-1.2.jar ||
    163163
    164164 * 最後用nutch 的 crawl 抓取網頁,搜索的結果就是按ik分過的中文詞
     165
     166 * 不使用修正過後的IK分詞庫,雖然nutch 爬取沒問題,也能建立正確的分詞庫,但索引網頁return 回來的頁面會是空白一片,可參考Debug 一節
     167
    165168
    166169= 修改 =