[[PageOutline]] = Crawlzilla v1.0 Release Note = == What's new? == * 更新Nutch核心版本1.2 * 多人共享:只需要申請一個帳號即可擁有自己的搜尋引擎 * 系統排程:系統任務設定完成後,可設定是否要即時執行,或預約Job的爬取時間 * 索引庫自動更新:設定更新頻率,讓搜尋引擎隨時擁有最新的資訊 * 軟體自動更新:自動偵測更新Crawlzilla管理版本 * 即時體驗網址:http://demo.crawlzilla.info/ == 安裝Crawlzilla == * 安裝方式同v0.3版 == 多人版本網頁操作簡易說明 == === 身份:網頁管理者 === 管理者為網頁操作管理權限最大的使用者,並不局限於系統的建立者,目前的開放權限如下: * 審核新的使用者 * 管理已註冊之使用者清單 * 瀏覽各使用者所建立的搜尋引擎數目,但無法瀏覽其他使用者的搜尋引擎內容 ==== 首次登入注意事項 ==== * 預設帳號為admin,預設密碼為crawler,基於安全考量,請於安裝完成後立即修改密碼 * 登入後請於"系統設定"選項設定管理者的e-mail位址 ==== 審核使用者帳號 ==== * 請於"系統選項"中,"會員帳號管理"進行使用者審核,如下圖依指示操作即可: * [[BR]][[Image(AcceptUser.png)]] === 身份:一般使用者 === ==== 使用者註冊 ==== * 進入註冊頁面,如下圖依指示輸入項目即可: * [[BR]][[Image(Reg.png)]] === 搜尋引擎建立及其他系統功能 === ==== 網頁爬取 ==== * 進入"crawl"選項,如下圖依指示操作即可: * [[BR]][[Image(SetCrawl.png)]] {{{ #!text 註:若無設定排成,當使用者送出時,則會立即執行此一任務,排程方法請參考以下。 }}} ===== 設定排程 ===== * 進入"crawl"選項,並開啟第二選項"排程設定(Option)",如下圖依指示操作即可: * [[BR]][[Image(SetCrawlSch.png)]] * 送出後畫面如下: * [[BR]][[Image(Submmit.png)]] ==== 索引庫管理 ==== 索引庫管理選項延續v3.0版本提供之功能,如下: * 刪除索引庫 * 重新爬取 * 瀏覽索引庫 ==== 排程已存在的搜尋引擎 ==== * 開啟"系統排程"選項,,如下圖依指示操作即可: * [[BR]][[Image(SysSch.png)]] * 送出後即可看到排程資訊,如下圖: * [[BR]][[Image(SysSchSubmmit.png)]] == 本文編輯環境 == * 作業系統:Ubuntu 10.04.2 LTS * Crawlzilla系統: Crawlzilla-1.0.110629.tar.gz (內部測試版本[http://sourceforge.net/projects/crawlzilla/files/testing/Crawlzilla-1.0/ also@Sourceforge Crawlzilla Testing Zone] ) * Crawlzilla網頁: crawlzilla-110629.war ''last modified: 2011/7/4''