wiki:NTUT160220

Version 4 (modified by jazz, 9 years ago) (diff)

--

Hadoop 資料處理平台入門班

課程日期

  • 105年02月20~21日 (週六/週日 白天9:30 ~17:30 ),共2天、計14小時 。

上課地點

課程內容

2016-02-20(六)

上午時段 課程內容 投影片 實作 補充資料
09:30~11:15 淺談巨量資料的趨勢、挑戰與因應對策 part-1
part-2
BDPMBOK 大數據專案管理知識體系
11:15~11:30 中場休息
11:30~12:00 Future of Big Data part-1
part-2
BDPMBOK 大數據專案管理知識體系
12:00~13:30 午餐、午休
下午時段 課程內容 投影片 實作 補充資料
11:15~12:00 實作一:Hadoop 單機安裝 實作一
實作二
11:10~12:00 Hadoop 簡介:緣起與術語 part-3
13:00~14:20 HDFS 觀念與指令解說 part-4
14:20~15:30 中場休息
15:30~16:30 實作二:HDFS 操作實務 實作三
實作四
09:30~11:10 MapReduce 簡介 part-5
11:10~11:20 中場休息
11:10~12:20 實作三:MapReduce 範例操作 實作五
實作六

2016-02-21(日)

上午時段 課程內容 投影片 實作 補充資料
13:30~14:00 Hadoop 相關專案(1) Hadoop Streaming part-6
14:00~14:25 實作五:Hadoop Streaming 操作練習 實作七
實作八
14:25~14:35 中場休息
14:35~15:30 Hadoop 相關專案(2) - Pig part-7 1.將 Pig 運算結果透過 DBStorage 存到 MySQL 資料庫
2. 將 Pig 運算結果透過 HBaseStorage 存到 HBase 資料庫
3. Pig 拿 XML 當輸入
15:30~16:00 實作六:Pig Latin 操作練習 實作九
16:00~16:10 中場休息
16:10~16:30 HBase 操作觀察 實作十 1.關於 NoSQL 的選擇依據 - YCSB
2. NoSQL 的種類
3. NoSQL vs NewSQL

參考書目

  1. Data-Intensive Text Processing with MapReduce (PDF),Jimmy Lin, University of Maryland

參考資料

Attachments (8)