Version 14 (modified by jazz, 13 years ago) (diff) |
---|
雲端運算之大量資料處理、分析與應用
報名資訊
課程源起
雲端運算掀起了新一代的資訊革命,也帶來了資訊爆炸式的成長,根據最新IDC研究報告指出: 2010年全球資料量將進入ZB(zettabytes,1 ZB 為1兆GB)時代,並且每年以60%的速度攀升, 這意味著每18個月全球的資料量將翻倍。面對不斷擴張的驚人資料量,大量資料的儲存、管理、處理 、搜尋、分析與智能應用等處理資料的能力將面臨新的挑戰,處理資料技術也迫切需要可動態與彈性 的特點,以支援大量資料處理的計算模式。 雲端運算使得分散式運算技術成了新顯學,整合MapReduce演算法並被各大企業所廣泛採用的 Hadoop套件,更是開發雲端運算技術的佼佼者,它是用來處理與保存大量資料的雲端運算平台。 全球各大IT企業(如:雅虎、IBM等)無不積極投資與推廣此一計算模式,並被作為雲端運算環境中 的重要基礎軟件。有了Hadoop軟體平台後,始可進行各項分析,如:電信業者如今可以分析手機在 基地台漫遊的特性,提供更好的在地費率;信用卡業者如今可以每天定期分析各種信用貸款所產生的 風險,動態調整信貸利率;便利超商如今可以分析消費者的購買習慣,動態調整架上存貨數量;甚至 新興產業,如生醫資訊、智慧電網等皆可運用Hadoop平台來進行資料探勘與趨勢預測。若您的企業 有儲存海量資料的需求,有分析海量資料的需求,或者面臨資料庫過度龐大,正在尋求分散式資料庫 或資料倉儲的技術,那Hadoop或許是一個已通過商業驗證的選擇。只要懂得駕馭Hadoop這隻大象, 它將能駝著您爬過一座座資料大山,幫您理出隱藏在群眾中的邏輯。
課程目標
學習雲端運算之三大關鍵技術,及利用Hadoop之分散式檔案系統(HDFS)與MapReduce,快速建構 出雲端運算的執行環境和服務,並以實作方式讓學員了解如何透過Hadoop架構以進行雲端資料的大量 資料處理、分析與應用。
課程特色
- 本課程屬於基礎觀念課程,不特別講解程式設計;
- 實作將採體驗式教學,亦即先透過指令剪貼方式,體驗一次操作,從體驗中驗證所學觀念。
適合對象
- IT經理或系統網路部門主管
- 專案經理、系統架構師或系統網路管理人員
- 企業或技術決策人員
- 對於私有雲端運算有興趣的人士
預備知識
- 具 Linux 操作實務與 Java 程式語言基礎者尤佳。
課程日期
- 100年10月22日~10月23日 ( 週六日白天9:00 ~17:00 ),共2天、計14小時 。
上課地點
- 資策會數位教育研究所,台北市信義路三段153號10樓。
- 位於捷運木柵線大安站斜對面(復興南路與信義路交叉口),燦坤樓上。
- 上課地點與教室之確認,以上課通知函為主。
課程內容
2011-10-22(六)
上午時段 課程內容 投影片 實作 補充資料 09:00~10:30 雲端運算三大關鍵技術介紹 part-1 10:30~10:40 中場休息 10:40~11:30 Hadoop 簡介:緣起與術語 part-2 11:30~12:00 實作一:Hadoop 單機安裝 實作一
實作二12:00~13:30 午餐、午休 下午時段 課程內容 投影片 實作 補充資料 13:30~14:50 HDFS 觀念與指令解說 part-3 14:50~15:10 實作二:HDFS 操作實務 實作三
實作四15:10~15:20 中場休息 15:20~16:00 MapReduce 簡介 part-4 16:00~16:30 實作三:MapReduce 範例操作 實作五
實作六16:30~17:00 今日課程回顧與問題討論
2011-10-23(日)
上午時段 課程內容 投影片 實作 補充資料 09:00~10:00 Hadoop 叢集安裝設定解說 part-5 10:00~10:30 實作四:Hadoop 程式編譯實務 實作七
實作八10:30~10:40 中場休息 10:40~11:10 Hadoop 相關專案(1) Hadoop Streaming part-6 11:10~12:00 實作五:Hadoop Streaming 操作練習 實作九
實作十下午時段 課程內容 投影片 實作 補充資料 13:30~14:50 Hadoop 相關專案(2) - Pig part-7 14:50~15:10 實作六:Pig Latin 操作練習 實作十一 15:10~15:20 中場休息 15:20~16:00 Hadoop 示範應用 - 抓抓龍(Crawlzilla) part-8 16:00~16:30 實作七:抓抓龍安裝操作(示範) 實作十二 16:30~17:00 今日課程回顧與問題討論 補充 Hadoop 示範應用 - 雲端入侵日誌分析系統(ICAS) part-9 示範網站
參考資料
- Hadoop 常見應用領域:
- Data Intensive Analytics with Hadoop: A Look Inside
- 金融業
- 2010-10-12 : VISA 採用 Hadoop 做風險評估 - HadoopWorld 2009 : Large Scale Transaction Analysis
- 中國信託
- 電信業
- 2011-06-12 : 中華電信用Hadoop技術分析通話明細
- 人力資源
- 行銷趨勢
- 科學教育
課程常用軟體
Attachments (11)
- part-1.pdf (2.6 MB) - added by jazz 13 years ago.
- part-2.pdf (1.3 MB) - added by jazz 13 years ago.
- part-3.pdf (385.4 KB) - added by jazz 13 years ago.
- part-4.pdf (342.7 KB) - added by jazz 13 years ago.
- part-5.pdf (1.8 MB) - added by jazz 13 years ago.
- part-6.pdf (1.2 MB) - added by jazz 13 years ago.
- part-7.pdf (1.2 MB) - added by jazz 13 years ago.
- part-8.pdf (3.3 MB) - added by jazz 13 years ago.
- part-9.pdf (1.8 MB) - added by jazz 13 years ago.
- 11-10-22_Big_Data_and_Hadoop.pdf (13.8 MB) - added by jazz 13 years ago.
- pietty0327.exe (316.5 KB) - added by jazz 13 years ago.