Changes between Version 2 and Version 3 of jazz/10-11-23
- Timestamp:
- Nov 23, 2010, 1:31:42 AM (14 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
jazz/10-11-23
v2 v3 1 1 = 2010-11-23 = 2 2 3 == Droids ==3 == Droids, Tika, Solr == 4 4 5 5 * Droids 則定位為給使用者自行撰寫 crawler 的工具。([wiki:jazz/10-10-17 2010-10-17]) 6 7 == Solr == 8 9 * Solr 是 Lucene 的子專案,是用來建立 index 的工具。([wiki:jazz/10-10-17 2010-10-17])從文件上看起來,感覺 Solr 比 Lucene 特殊的地方在於支援資料庫。 6 * [http://tika.apache.org/ Apache Tika] - a content analysis toolkit 7 * Tika 使用來解析 metadata 的工具,爬完之後,應該就是要經過 Tika 的解析來了解內容。 8 * Solr 是 Lucene 的子專案,是用來建立 index 的工具。([wiki:jazz/10-10-17 2010-10-17]) 從文件上看起來,感覺 Solr 比 Lucene 特殊的地方在於支援資料庫。