= Crawlzilla 2.0 = * 近期發現的 Bug / 缺點 * install 程式不支援無線網卡 * 升級/反安裝 -> 舊的資料如何保存或移植延續?!(Stateless) * 想法: * 套件化(分離 Nutch, Lucene, Hadoop 的部份) - 預設用單機版 * 與 Solr 結合 -> 與 ElasticSearch 結合?! * 與 Carrot2 結合? 搜尋結果分群分類(Search Clustering) * 套件相依: * bc {{{ 480: large16=$(echo "$JAVA_version >= 1.6" | bc) }}} * dialog * expect * lsb_release {{{ ./install: line 593: expect: command not found ./install: line 968: lsb_release: command not found }}} * 過去有人提報過的 Nutch Debian 套件 WNPP * http://lists.debian.org/debian-wnpp/2006/02/msg00225.html