wiki:III141129

Version 1 (modified by jazz, 10 years ago) (diff)

--

Big Data之處理與分析實務班

報名資訊

課程目標

學習雲端運算之三大關鍵技術,及利用Hadoop之分散式檔案系統(HDFS)與MapReduce,快速建構
出雲端運算的執行環境和服務,並以實作方式讓學員了解如何透過Hadoop架構以進行雲端資料的大量
資料處理、分析與應用。

課程特色

  • 本課程屬於基礎觀念課程,不特別講解程式設計;
  • 實作將採體驗式教學,亦即先透過指令剪貼方式,體驗一次操作,從體驗中驗證所學觀念。

適合對象

  • IT經理或系統網路部門主管
  • 專案經理、系統架構師或系統網路管理人員
  • 企業或技術決策人員
  • 對於私有雲端運算有興趣的人士

預備知識

  • 具 Linux 操作實務與 Java 程式語言基礎者尤佳。

課程日期

  • 103年11月29~30日 (週六/週日 白天9:30 ~17:30 ),共2天、計14小時 。

上課地點

  • 資策會數位教育研究所。
  • 位於捷運木柵線大安站斜對面(復興南路與信義路交叉口)。
  • 上課地點與教室之確認,以上課通知函為主。

課程內容

2014-11-29(六)

上午時段 課程內容 投影片 實作 補充資料
09:30~11:05 淺談巨量資料的趨勢、挑戰與因應對策 part-1
11:05~11:15 中場休息
11:15~12:00 處理巨量資料的資訊架構與關鍵技術 part-2
12:00~13:00 午餐、午休
下午時段 課程內容 投影片 實作 補充資料
11:10~12:00 實作一:Hadoop 單機安裝 實作一
實作二
13:00~14:20 Hadoop 簡介:緣起與術語 part-3
14:20~15:30 HDFS 觀念與指令解說 part-4
15:30~15:40 中場休息
15:40~17:30 實作二:HDFS 操作實務 實作三
實作四

2014-10-26(日)

上午時段 課程內容 投影片 實作 補充資料
09:30~11:10 MapReduce 簡介 part-5
11:10~11:20 中場休息
11:10~12:20 實作三:MapReduce 範例操作 實作五
實作六
下午時段 課程內容 投影片 實作 補充資料
13:30~14:00 Hadoop 相關專案(1) Hadoop Streaming part-7
14:00~14:25 實作五:Hadoop Streaming 操作練習 實作七
實作八
14:25~14:35 中場休息
14:35~15:30 Hadoop 相關專案(2) - Pig part-8 1.將 Pig 運算結果透過 DBStorage 存到 MySQL 資料庫
2. 將 Pig 運算結果透過 HBaseStorage 存到 HBase 資料庫
3. Pig 拿 XML 當輸入
15:30~16:00 實作六:Pig Latin 操作練習 實作九
16:00~16:10 中場休息
16:10~17:30 HBase 操作觀察 part-7 實作十 1.關於 NoSQL 的選擇依據 - YCSB
2. NoSQL 的種類
3. NoSQL vs NewSQL

參考書目

  1. Data-Intensive Text Processing with MapReduce (PDF),Jimmy Lin, University of Maryland

參考資料

Attachments (8)