Changes between Version 15 and Version 16 of nutchez2


Ignore:
Timestamp:
May 24, 2010, 11:38:40 AM (14 years ago)
Author:
waue
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • nutchez2

    v15 v16  
    2626
    2727 == 5st (5/28) ==
    28  * 測試Master & Slave 安裝程式
    29 
     28 === rock ===
     29Slave 安裝程式demo
     30 === fafa ===
     31Master  安裝程式demo
     32 === waue ===
     33 * 目錄架構
    3034 ||  說明  || 路徑  || 擁有者身份  ||
    3135 ||  nutchez 家目錄  || /opt/nutchez/  || nutchuser  ||
     
    3741 ||  nutchez 使用者目錄 || /home/nutchuser/nutchez/ || nutchuser ||
    3842 ||  nutchez 索引資料庫 || /home/nutchuser/nutchez/search/ || 由nutch完成crawl後產生 ||
    39 
    40  * 修改 /opt/nutchez/nutch/conf/ 的 hadoop-site.xml
     43 * [http://trac.nchc.org.tw/cloud/export/124/nutchez-0.2/package/nutchez-0.2-20100524.tar.gz 下載修改後 nutch 叢集版 的壓縮檔]
     44   * 設定叢集驅動模式( /opt/nutchez/nutch/conf/ 的 hadoop-site.xml )
    4145{{{
    4246#!xml
     
    4448  <property>
    4549    <name>fs.default.name</name>
    46     <value>hdfs://secuse.nchc.org.tw:9000</value>
     50    <value>hdfs://localhost:9000</value>
    4751  </property>
    4852  <property>
    4953    <name>mapred.job.tracker</name>
    50     <value>secuse.nchc.org.tw:9001</value>
     54    <value>localhost:9001</value>
    5155  </property>
    5256  <property>
     
    5660</configuration>
    5761}}}
    58 
    59  * 改tomcat port => /opt/nutchez/tomcat/conf/ 的 server.xml
    60 
    61 {{{
    62 #!xml
    63    <Connector port="8080" protocol="HTTP/1.1"
    64                connectionTimeout="20000"
    65                redirectPort="8443" URIEncoding="UTF-8"
    66                useBodyEncodingForURI="true" />
    67 }}}
    68 
    69  * 最後的搜尋結果 => /opt/nutchez/tomcat/webapps/ROOT/WEB-INF/classes/ 的 nutch-site.xml
    70 
     62   * 設定 最後的搜尋結果 ( /opt/nutchez/tomcat/webapps/ROOT/WEB-INF/classes/ 的 nutch-site.xml )
    7163{{{
    7264#!xml
     
    7870</configuration>
    7971}}}
    80 
    81  * /opt/nutchez/nutch/bin/nutch 執行檔有改
    82 
     72   * 使 nutch 主程式引入環境變數 (改 /opt/nutchez/nutch/bin/nutch  )
    8373{{{
    8474#!sh
     
    8777NUTCH_LOG_DIR=/var/nutchez/logs
    8878}}}
    89 
    90  * 用 改版的 nutchez 的 hadoop 還是要format 與 start-all.sh
    91 
    92 
     79   * 叢集版的 nutch ,要使用之前,要先執行 hadoop format 與 start-all.sh
    9380
    9481 = [wiki:waue/2010/nutchez2_archi 二、系統架構(編輯)] =