= 2010-11-23 = == Droids, Tika, Solr == * Droids 則定位為給使用者自行撰寫 crawler 的工具。([wiki:jazz/10-10-17 2010-10-17]) * [http://tika.apache.org/ Apache Tika] - a content analysis toolkit * Tika 使用來解析 metadata 的工具,爬完之後,應該就是要經過 Tika 的解析來了解內容。 * Solr 是 Lucene 的子專案,是用來建立 index 的工具。([wiki:jazz/10-10-17 2010-10-17]) 從文件上看起來,感覺 Solr 比 Lucene 特殊的地方在於支援資料庫。