Changes between Initial Version and Version 1 of III140705


Ignore:
Timestamp:
Jul 5, 2014, 8:20:57 AM (10 years ago)
Author:
jazz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • III140705

    v1 v1  
     1{{{
     2#!html
     3<div style="text-align: center;"><big
     4 style="font-weight: bold;"><big><big>雲端 Big Data 之處理、分析與應用(進階班)</big></big></big></div>
     5}}}
     6[[PageOutline]]
     7
     8= 報名資訊 =
     9
     10 * 詳[http://www.iiiedu.org.tw/ites/CBDA.htm 資策會網站公告]
     11
     12= 課程日期 =
     13
     14 * 104年07月05~06日 (週六/週日 白天9:30 ~16:30 ),共2天、計12小時 。
     15
     16= 上課地點 =
     17
     18 * 資策會數位教育研究所。
     19 * 位於捷運木柵線大安站斜對面(復興南路與信義路交叉口)。
     20 * 上課地點與教室之確認,以上課通知函為主。
     21
     22= 課程內容 =
     23
     24 * [raw-attachment:wiki:III140705:part-1.pdf 完整版投影片]
     25
     26== '''2014-07-05(六)''' ==
     27
     28 || 時段 || 課程內容 || 投影片[[BR]]實作步驟 || 補充資料 ||
     29 || 09:30-11:00 || Big Data 處理技術與 Hadoop 簡介 || [raw-attachment:wiki:III140705:part-1.pdf 投影片] || * 重點一:減少資料搬運的頻寬成本跟時間成本 [[BR]] * 重點二:在地運算(Data Locality) ||
     30 || 11:00-11:20 || Hadoop 的三種模式與三種安裝方法 || || * http://hadoop.apache.org - Hadoop 專案官方首頁 [[BR]] * http://www.cloudera.com - RPM/DEB 套件庫 : [http://www.etusolution.com/index.php/tw/ 精誠知意圖(Etu)] [[BR]] * http://hortonworks.com - HDP for Windows : [http://www.tcloudcomputing.com.tw 趨勢騰雲(TCloud)] [[BR]] * http://www.mapr.com - MapR : [http://www.is-land.com.tw 亦思科技] ||
     31 || 11:20-12:00 || 單機模式(Local Mode)操作觀察  || [wiki:III140705/Lab1 實作一] || * [http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/SingleCluster.html 阿帕契基金會官網單機安裝流程] ||
     32 || 12:00-12:25 || 偽分散式模式(Pseudo-Distributed Mode)操作觀察  || [wiki:III140705/Lab2 實作二] || * [http://trac.3du.me/cloud/wiki/NTU131002/Lab2 官方 Hadoop 2.0 版的自動化安裝] ||
     33 || 12:25-13:30 || 午餐時間 || || ||
     34 || 13:30-13:45 || 全分散式模式(Full Distributed Mode)操作觀察  || [wiki:III140705/Lab3 實作三] || ||
     35 || 13:45-14:00 || HDFS 基本指令操作 || [wiki:III140705/Lab4 實作四] || ||
     36 || 14:00-14:20 || 基本除錯技能(一) Bash 除錯 || [wiki:III140705/Lab5 實作五] || ||
     37 || 14:20-14:30 || 基本除錯技能(二) Log4J || [wiki:III140705/Lab6 實作六] || ||
     38 || 14:20-14:40 || 基本除錯技能(三) 切換 Hadoop 設定檔 || [wiki:III140705/Lab7 實作七] || ||
     39 || 略過 || MapReduce 基本指令操作 || [wiki:III140705/Lab8 實作八] || ||
     40 || 15:00-15:20 || Hadoop !FileSystem API 原始碼觀察 || [wiki:III140705/Lab9 實作九] || ||
     41 || 15:20-15:40 || Hadoop !FileSystem API 實作(一) [[BR]] Local 檔案上傳到 HDFS || [wiki:III140705/Lab10 實作十] || ||
     42 || 15:40-15:50 || Hadoop !FileSystem API 實作(二) [[BR]] HDFS 下載檔案到 Local || [wiki:III140705/Lab11 實作十一] || ||
     43 || 15:50-16:00 || Hadoop !FileSystem API 實作(三) [[BR]] 判斷檔案是否存在、屬性為何 || [wiki:III140705/Lab12 實作十二] || ||
     44
     45== '''2014-07-06(日)''' ==
     46
     47 || 時段 || 課程內容 || 實作 || 補充資料 ||
     48 || 略過 || Windows 版 Hadoop 安裝 (1) Hadoop4Win || [wiki:III140705/Lab13 實作十三] || * http://www.hadoop4win.org ||
     49 || 09:30-10:00 || Windows 版 Hadoop 安裝 (2) Windoop || [wiki:III140705/Lab14 實作十四] || * http://code.google.com/p/windoop ||
     50 || 10:00-10:30 || Hadoop Eclipse Plugin 功能展示 || '''操作展示''' || ||
     51 || 略過 || 課後練習補充資料 || || * 如何自己建立練習環境 [[BR]] * [http://forum.hadoop.tw/viewtopic.php?f=7&t=36011 CCDH / CCAH 考試認證指南] [[BR]] * [http://forum.hadoop.tw/ Hadoop.TW 技術討論區] [[BR]] * [https://www.facebook.com/groups/hadoop.tw/ 臉書 Hadoop.TW 社團] [[BR]] * [http://classcloud.org/media 歷史課程錄影] ||
     52 || 10:30-10:40 || 中場休息 || || ||
     53 || 10:40-11:00 || [wiki:WordCountNewVerstion 新版 Hadoop MapReduce 語法 (0.19以後)] [[BR]] 使用 !WordCount 範例解說 || [wiki:III140705/Lab15 實作十五] || ||
     54 || 11:00-12:00 || MapReduce 『邏輯流』解說 || [wiki:III140705/MapReduce_Logic_Flow 圖解說明] || ||
     55 || 12:00-12:20 || [wiki:WordCount 舊版 Hadoop MapReduce 語法 (0.19以前)] [[BR]] 使用 !WordCount 範例解說 || [wiki:III140705/Lab16 實作十六] || ||
     56 || 12:20-13:20 || 午餐時間 || || ||
     57 || 13:20-13:45 || Inner Class v.s. Public Classes || [wiki:III140705/Lab17 實作十七] || ||
     58 || 13:45-14:00 || 增加 Reducer 個數:Job.setNumReduceTasks(N) || [wiki:III140705/Lab18 實作十八] || ||
     59 || 14:00-14:15 || 觀察 Mapper 中間產物:Job.setNumReduceTasks(0) || [wiki:III140705/Lab19 實作十九] || ||
     60 || 14:15-14:30 || 中場休息 ||
     61 || 14:40-15:00 || 預設的輸入格式:!TextInputFormat || [wiki:III140705/Lab20 實作二十] || ||
     62 || 15:00-15:20 || 修改檔案輸入格式:!KeyValueTextInputFormat || [wiki:III140705/Lab21 實作二十一] || ||
     63 || 15:20-16:00 || MapReduce 『資料流』解說 || [wiki:III140705/MapReduce_Data_Flow 圖解說明] || ||
     64 || 16:00-16:20 || 關於 MapReduce 的設定檔 Configuration || [wiki:III140705/Lab22 實作二十二] || ||
     65 || 16:20-16:30 || 如果我需要兩個輸入檔呢? [[BR]] Distribtued Cache || [wiki:III140705/Lab23 實作二十三] || ||
     66
     67= 補充設定 =
     68
     69 * screenrc 範例
     70{{{
     71$ cat > ~/.screenrc <<EOF
     72caption always "%{= wk} %{= KY} [%n]%t @ %H %{-} %= %{= KR} %l %{-} | %{= KG} %Y-%m-%d %{-} "
     73hardstatus alwayslastline " %-Lw%{= Bw}%n%f %t%{-}%+Lw %=|"
     74vbell off
     75EOF
     76}}}
     77
     78 * 檢查 Java 記憶體使用量
     79{{{
     80top -p `pidof java | sed 's# #,#g'`
     81}}}
     82
     83= 補充 =
     84 
     85   * [http://trac.3du.me/cloud/wiki/NCHCCloudCourse100928_2_IDE 編譯環境設定- 安裝 Eclipse 3.3.2 與 Hadoop 外掛程式]
     86   * [http://trac.3du.me/cloud/wiki/NCHCCloudCourse100928/Netbeans 安裝 Netbean 6.9.1 中文版與 KamaSphere Studio 外掛程式]
     87 * 修改 mapred-site.xml 的參數,增加 mapper 與 reducer 的 slot 個數
     88{{{
     89  <property>
     90    <name>mapred.tasktracker.map.tasks.maximum</name>
     91    <value>4</value>
     92  <property>
     93  <property>
     94    <name>mapred.tasktracker.reduce.tasks.maximum</name>
     95    <value>4</value>
     96  <property>
     97}}}
     98
     99 * https://developer.yahoo.com/hadoop/tutorial/module7.html
     100   - 其他參數設定的參考
     101 * 安裝 Ganglia
     102{{{
     103sudo apt-get -y install ganglia-webfrontend gmetad ganglia-monitor
     104}}}
     105
     106= 公用環境 =
     107
     108 * 課後問題討論,建議優先至台灣 Hadoop 使用者討論區 http://forum.hadoop.tw 或臉書粉絲團 https://www.facebook.com/groups/hadoop.tw/ 進行討論。