{{{ #!html
雲端運算之大量資料處理、分析與應用
}}} [[PageOutline]] = 報名資訊 = * 詳[http://www.iiiedu.org.tw/ites/CBD.htm 資策會網站公告] = 課程源起 = {{{ #!text 雲端運算掀起了新一代的資訊革命,也帶來了資訊爆炸式的成長,根據最新IDC研究報告指出: 2010年全球資料量將進入ZB(zettabytes,1 ZB 為1兆GB)時代,並且每年以60%的速度攀升, 這意味著每18個月全球的資料量將翻倍。面對不斷擴張的驚人資料量,大量資料的儲存、管理、處理 、搜尋、分析與智能應用等處理資料的能力將面臨新的挑戰,處理資料技術也迫切需要可動態與彈性 的特點,以支援大量資料處理的計算模式。 雲端運算使得分散式運算技術成了新顯學,整合MapReduce演算法並被各大企業所廣泛採用的 Hadoop套件,更是開發雲端運算技術的佼佼者,它是用來處理與保存大量資料的雲端運算平台。 全球各大IT企業(如:雅虎、IBM等)無不積極投資與推廣此一計算模式,並被作為雲端運算環境中 的重要基礎軟件。有了Hadoop軟體平台後,始可進行各項分析,如:電信業者如今可以分析手機在 基地台漫遊的特性,提供更好的在地費率;信用卡業者如今可以每天定期分析各種信用貸款所產生的 風險,動態調整信貸利率;便利超商如今可以分析消費者的購買習慣,動態調整架上存貨數量;甚至 新興產業,如生醫資訊、智慧電網等皆可運用Hadoop平台來進行資料探勘與趨勢預測。若您的企業 有儲存海量資料的需求,有分析海量資料的需求,或者面臨資料庫過度龐大,正在尋求分散式資料庫 或資料倉儲的技術,那Hadoop或許是一個已通過商業驗證的選擇。只要懂得駕馭Hadoop這隻大象, 它將能駝著您爬過一座座資料大山,幫您理出隱藏在群眾中的邏輯。 }}} = 課程目標 = {{{ #!text 學習雲端運算之三大關鍵技術,及利用Hadoop之分散式檔案系統(HDFS)與MapReduce,快速建構 出雲端運算的執行環境和服務,並以實作方式讓學員了解如何透過Hadoop架構以進行雲端資料的大量 資料處理、分析與應用。 }}} = 課程特色 = * 本課程屬於基礎觀念課程,不特別講解程式設計; * 實作將採體驗式教學,亦即先透過指令剪貼方式,體驗一次操作,從體驗中驗證所學觀念。 = 適合對象 = * IT經理或系統網路部門主管 * 專案經理、系統架構師或系統網路管理人員 * 企業或技術決策人員 * 對於私有雲端運算有興趣的人士 = 預備知識 = * 具 Linux 操作實務與 Java 程式語言基礎者尤佳。 = 課程日期 = * 100年10月22日~10月23日 ( 週六日白天9:00 ~17:00 ),共2天、計14小時 。 = 上課地點 = * 資策會數位教育研究所,台北市信義路三段153號10樓。 * 位於捷運木柵線大安站斜對面(復興南路與信義路交叉口),燦坤樓上。 * 上課地點與教室之確認,以上課通知函為主。 = 課程內容 = * [raw-attachment:wiki:III110813:11-10-22_Big_Data_and_Hadoop.pdf 完整版投影片] == '''2011-10-22(六)''' == || 上午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || || 09:00~10:30 || 雲端運算三大關鍵技術介紹 || [raw-attachment:wiki:III110813:part-1.pdf part-1] || || || || 10:30~10:40 || 中場休息 || || || || || 10:40~11:30 || Hadoop 簡介:緣起與術語 || [raw-attachment:wiki:III110813:part-2.pdf part-2] || || || || 11:30~12:00 || 實作一:Hadoop 單機安裝 || || [wiki:III110813/Lab1 實作一] || || || 12:00~13:30 || 午餐、午休 || || || || || 下午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || || 13:30~14:50 || HDFS 觀念與指令解說 || [raw-attachment:wiki:III110813:part-3.pdf part-3] || || || || 14:50~15:10 || 實作二:HDFS 操作實務 || || [wiki:III110813/Lab2 實作二] || || || 15:10~15:20 || 中場休息 || || || || || 15:20~16:00 || MapReduce 簡介 || [raw-attachment:wiki:III110813:part-4.pdf part-4] || || || || 16:00~16:30 || 實作三:MapReduce 範例操作 || || [wiki:III110813/Lab3 實作三] || || || 16:30~17:00 || 今日課程回顧與問題討論 || || || || == '''2011-10-23(日)''' == || 上午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || || 09:00~10:00 || Hadoop 叢集安裝設定解說 || [raw-attachment:wiki:III110813:part-5.pdf part-5] || || || || 10:00~10:30 || 實作四:Hadoop 叢集安裝實務 || || [wiki:III110813/Lab4 實作四] || || || 10:30~10:40 || 中場休息 || || || || || 10:40~11:10 || Hadoop 相關專案(1) Hadoop Streaming || [raw-attachment:wiki:III110813:part-6.pdf part-6] || || || || 11:10~12:00 || 實作五:Hadoop Streaming 操作練習 || || [wiki:III110813/Lab5 實作五] || || || 下午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || || 13:30~14:50 || Hadoop 相關專案(2) - Pig || [raw-attachment:wiki:III110813:part-7.pdf part-7] || || || || 14:50~15:10 || 實作六:Pig Latin 操作練習 || || [wiki:III110813/Lab6 實作六] || || || 15:10~15:20 || 中場休息 || || || || || 15:20~16:00 || Hadoop 示範應用 - 抓抓龍(Crawlzilla) || [raw-attachment:wiki:III110813:part-8.pdf part-8] || || || || 16:00~16:30 || 實作七:抓抓龍安裝操作 || || [wiki:III110813/Lab7 實作七] || || || 16:30~17:00 || 今日課程回顧與問題討論 || || || ||