{{{ #!html
大數據與 Hadoop 開源系統軟體
}}} [[PageOutline]] = 上課地點 = * 資 104 * https://www.csie.ntu.edu.tw/intro/super_pages.php?ID=intro4 = 課程內容 = * [raw-attachment:wiki:NTUOSS160412:part-1.pdf 完整版投影片] == '''2016-04-12''' == || 時段 || 課程內容 || 投影片[[BR]]實作步驟 || 補充資料 || || 09:00-10:00 || Big Data 處理技術與 Hadoop 簡介 || [raw-attachment:wiki:NTUOSS160412:part-1.pdf 投影片] || * 重點一:減少資料搬運的頻寬成本跟時間成本 [[BR]] * 重點二:在地運算(Data Locality) || || 10:00-12:00 || 淺談巨量資料專案的導入規劃與相關經驗分享 || || [raw-attachment:wiki:NTUOSS160412:part-2.pdf 投影片] || || == Self Learning == || Hadoop 的三種模式與三種安裝方法 || * http://hadoop.apache.org - Hadoop 專案官方首頁 [[BR]] * http://www.cloudera.com - RPM/DEB 套件庫 : [http://www.etusolution.com/index.php/tw/ 精誠知意圖(Etu)] [[BR]] * http://hortonworks.com - HDP for Windows : [http://www.tcloudcomputing.com.tw 趨勢騰雲(TCloud)] [[BR]] * http://www.mapr.com - MapR : [http://www.is-land.com.tw 亦思科技] || || 如何自己建立練習環境 || - [http://www.cloudera.com/content/support/en/downloads/quickstart_vms/cdh-5-0-x.html CDH] / [http://hortonworks.com/products/hortonworks-sandbox/#install HDP] [[BR]] * [http://go.cloudera.com/cloudera-live.html Cloudera Live - Hue 介面練習] || || 本土社群學習資源 || * [http://forum.hadoop.tw/viewtopic.php?f=7&t=36011 CCDH / CCAH 考試認證指南] [[BR]] * [http://forum.hadoop.tw/ Hadoop.TW 技術討論區] [[BR]] * [https://www.facebook.com/groups/hadoop.tw/ 臉書 Hadoop.TW 社團] [[BR]] * [http://www.youtube.com/playlist?list=PL_CuZWRrYyz0ObsY409EVh66vkdtFpIWN 歷史課程錄影] || == Hands-On Labs == || 單機模式(Local Mode)操作觀察 || [wiki:NTUOSS160412/Lab1 實作一] || * http://koding.com/login [[BR]] * [http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/SingleCluster.html 阿帕契基金會官網單機安裝流程] || || 偽分散式模式(Pseudo-Distributed Mode)操作觀察 || [wiki:NTUOSS160412/Lab2 實作二] || * [http://trac.3du.me/cloud/wiki/NTU131002/Lab2 官方 Hadoop 2.0 版的自動化安裝] || || 全分散式模式(Full Distributed Mode)操作觀察 || [wiki:NTUOSS160412/Lab3 實作三] || || || HDFS 基本指令操作 || [wiki:NTUOSS160412/Lab4 實作四] || || || MapReduce 基本指令操作 || [wiki:NTUOSS160412/Lab5 實作五] || || || Hadoop !FileSystem API 原始碼觀察 || [wiki:NTUOSS160412/Lab6 實作六] || || || WordCount 範例程式編譯 || [wiki:NTUOSS160412/Lab7 實作七] || || == Homework == || '''Basic''' || '''!ReverseIndex''' || [wiki:NTUOSS160412/HW1 HW1] || || || Extra || !PageRank || || [http://www.csie.ntu.edu.tw/~bigdata/bigdata2013f.html#lab CSIE Big Data Systems - Fall 2013 - Professor Shih-wei Liao] || = 補充設定 = * screenrc 範例 {{{ $ cat > ~/.screenrc < mapred.tasktracker.map.tasks.maximum 4 mapred.tasktracker.reduce.tasks.maximum 4 }}} * https://developer.yahoo.com/hadoop/tutorial/module7.html - 其他參數設定的參考 * 安裝 Ganglia {{{ sudo apt-get -y install ganglia-webfrontend gmetad ganglia-monitor }}} = 公用環境 = * 課後問題討論,建議優先至台灣 Hadoop 使用者討論區 http://forum.hadoop.tw 或臉書粉絲團 https://www.facebook.com/groups/hadoop.tw/ 進行討論。