Changes between Version 3 and Version 4 of jazz/10-11-23


Ignore:
Timestamp:
Nov 23, 2010, 1:40:11 AM (14 years ago)
Author:
jazz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • jazz/10-11-23

    v3 v4  
    11= 2010-11-23 =
    22
    3 == Droids, Tika, Solr ==
     3== Nutch, Droids, Tika, Solr ==
    44
    55 * Droids 則定位為給使用者自行撰寫 crawler 的工具。([wiki:jazz/10-10-17 2010-10-17])
    66 * [http://tika.apache.org/ Apache Tika] - a content analysis toolkit
    77   * Tika 使用來解析 metadata 的工具,爬完之後,應該就是要經過 Tika 的解析來了解內容。
    8  * Solr 是 Lucene 的子專案,是用來建立 index 的工具。([wiki:jazz/10-10-17 2010-10-17]) 從文件上看起來,感覺 Solr 比 Lucene 特殊的地方在於支援資料庫。
     8 * Solr 是 Lucene 的子專案,是用來建立 index 的工具。([wiki:jazz/10-10-17 2010-10-17]) 從文件上看起來,感覺 Solr 比 Lucene 特殊的地方在於支援資料庫。目前 Debian/Ubuntu 有多個 solr 相關的套件
     9  * [http://packages.debian.org/libwebservice-solr-perl libwebservice-solr-perl] - Perl interface for the Solr (Lucene) web service
     10  * [http://packages.debian.org/solr-common solr-common] - enterprise search server based on Lucene - common files
     11  * [http://packages.debian.org/solr-jetty solr-jetty] - enterprise search server based on Lucene - Jetty integration
     12  * [http://packages.debian.org/solr-tomcat solr-tomcat] - enterprise search server based on Lucene - Tomcat integration
     13
     14 * 安裝 Droids - [參考] [https://cwiki.apache.org/confluence/display/DROIDS/installation Droids 安裝文件]
     15{{{
     16~$ sudo apt-get install maven2 subversion
     17~$ mkdir droids
     18~$ cd droids
     19~/droids$ svn co https://svn.apache.org/repos/asf/incubator/droids/trunk .
     20~/droids$ mvn clean install
     21}}}