{{{ #!html
如何使用自由軟體執行雲端運算資料搜尋、分析與備份
}}} [[PageOutline]] = 課程資訊 = * 課程名稱:如何使用自由軟體執行雲端運算資料搜尋、分析與備份 * 課程時數:6小時 * 課程對象:資訊人員(雲端運算應用程式開發者和資訊中心管理者) * 上課方式:課堂講授與示範 * 課程目標: 讓資訊人員了解:如何不需要自己建置主機和OS平台,而是透過網路利用雲端運算「平台即服務(PaaS)」的架構,就可以執行資訊的備份、搜尋、分析業務。這樣就可以大幅節省主機維護和排解疑難的預算、人力和時間。 = 課程內容 = == 2011-08-29 == || 主題 || 大綱 || 實作 || || 平台即服務(PaaS)簡介 || 雲端運算服務的基本概念 || || || 使用自由軟體打造PaaS || 資料異機同步儲存的機制:Dropbox [[BR]] 巨量資料分析處理平台:Hadoop [[BR]] 打造私有資料的搜尋引擎:Nutch [[BR]] 多種檔案格式的搜尋引擎:Crawlzilla || http://demo.crawlzilla.info [[BR]] http://crawlweb2.nchc.org.tw/icas [[BR]] http://www.dropbox.com || || || [raw-attachment:wiki:Hinet110427:part-4.pdf 補充一:HDFS 補充] || [wiki:FDC110829/Lab1 實作一] - 實驗叢集帳號申請 [[BR]] http://www.virtualbox.org [[BR]] http://drbl-hadoop.sf.net [[BR]] [wiki:FDC110829/Lab2 實作二] - HDFS 操作實務 || || || [raw-attachment:wiki:Hinet110427:part-5.pdf 補充二:MapReduce 補充] || [wiki:FDC110829/Lab3 實作三] - MapReduce 範例初探[[BR]][wiki:FDC110829/Lab4 實作四] - MapReduce 程式編譯 || || || [raw-attachment:wiki:NCHCCloudCourse100928:part-2.pdf 補充三:Hadoop 生態系補充] || [wiki:FDC110829/Lab5 實作五] - Hadoop Streaming 初探 [[BR]][wiki:FDC110829/Lab6 實作六] - <範例> 用 Hadoop Streaming 做生物資訊(或 OCR 軟體) ||