Parallel Environment and Programming
課程資訊 Course Info.
- 上課時間: 2011/3/29 (二) ~ 2011/4/26 (二) 13:30 ~ 16:20
- Date and Time: 13:30 to 16:20, from 29 March 2011 to 26 April. 2011, every Tuesday
- 上課地點: 交通大學 工程三館 EC315 電腦教室
- Location: EC315, Natioanl Chiao-Tung University
課程大綱 Course Outline
Section課程內容 Topics 投影片
Notes3/29 Introduction - 雲端運算的緣起、趨勢與定義
- Introduction to Cloud Computing Technologiespart-1 實作一 3/29 Introduction - 雲端運算核心技術一:運用虛擬化技術打造 IaaS
- Introduction to Virtualizationpart-2 實作二 4/12 Hands-On - 雲端運算核心技術二:運用資料探勘技術打造 PaaS
- Introduction to Hadoop
- Introduction to HDFSpart-3 實作三
4/19 Hands-On - 雲端運算核心技術二:運用資料探勘技術打造 PaaS
- Introduction to MapReduce
- MapReduce 程式架構簡介與編譯練習
- MapReduce Programming 101part-3
實作六使用 Eclipse 開發 Hadoop 程式
- Yahoo! Developer Network - Hadooop Tutorial 有介紹如何調整 Hadoop 參數的參考數據
- 在網路不穩定的環境下,為了保持 SSH 連線的畫面,常常會使用 screen 來作為長時間登入伺服器的工具。使用 screen 後,就可以在 ssh client 不正常關閉或網路斷線後,仍可以接回原本的畫面。
- screenrc 範例
- [備註] 拿掉時鐘的部份,以免造成往上捲動會不斷被拉回的困擾。
$ cat > .screenrc <<EOF caption always "%{= wk} %{= KY} [%n]%t @ %H %{-} %= %{= KR} %l %{-} | %{= KG} %Y-%m-%d %{-} " hardstatus alwayslastline " %-Lw%{= Bw}%n%f %t%{-}%+Lw %=|" EOF
- 快速鍵
- CTRL + a + 0 ~ 9 – 從第一個視窗切換到第九個視窗
- CTRL + a + n – 切換到下一個(還存在)的視窗
- CTRL + a + Backspace – Switches to the previous available
- CTRL + a + a – 切換到跟最後一次切換的視窗
- CTRL + a + A – 切換視窗"抬頭"
- CTRL + a + K – 關閉目前視窗
- CTRL + a + c – 開啟一個新的視窗
- CTRL + a + [ - 進入 copy mode,方便上下捲動歷史紀錄(因為常用的 SHIFT + PgUp/PgDn? 會失效)
- CTRL + a + ESC - 進入 copy mode,方便上下捲動歷史紀錄(因為常用的 SHIFT + PgUp/PgDn? 會失效)
- Ctrl + a + S - 分割視窗
- Ctrl + a + Tab - 在視窗中移動
- Ctrl + a + Q - 取消分割
- [備註] 拿掉時鐘的部份,以免造成往上捲動會不斷被拉回的困擾。
作業 Homework
- 題目:請嘗試將 實作六 的 改成逆向索引(Reverse Index)。使 ReverseIndex 執行之結果為「"關鍵字"\t"檔案名稱(用逗點隔開)"」型態。以實作六最後的執行方法,忽略句點(\.)與逗點(\,),並且忽略大小寫(case.sensitive=false),
- Please try to modified downloaded from Lab6. Rename it to Let ReverseIndex output as "Keyword <TAB> filename(separated by comma)". Try to run it by ignoring "\." and "\," pattern and case-insensitive.
- 結果應該為:
The result should be as following:and input2 cloud input1,input2 course input1,input2,input2 enjoy input2 i input1,input2 like input1,input2 nctu input1,input2 this input2 we input2
- 參考步驟:
Here is the reference steps:$ wget -O $ vi #### DO YOUR MODIFICATION - 修改對應的程式碼 $ mkdir -p MyJava3 $ javac -classpath hadoop-core.jar -d MyJava3 $ hadoop jar reverseindex.jar ReverseIndex lab6_input lab6_out4 -skip pattern.txt
- 繳交期限:2011年5月3日(二) 上午 11:59
- Due date: 11:59 AM, Tuesday, May 3th, Year 2011
- 繳交方式:將原始碼與報告以附件方式寄至 jazz _AT_ nchc _DOT_ org _DOT_ tw (1) 程式原始碼一份:以 ${學號}.zip 方式壓縮與命名 (2) 報告一份:以 ${學號} 命名。
- Please e-mail the java source code and report (doc or PDF) to jazz _AT_ nchc _DOT_ org _DOT_ tw
- 提示:
Hint:- 請將 Mapper 輸出、Reducer 輸入輸出的 (Key,Value) 由原本的 (Text, IntWritable) 改成 (Text, Text)
- Replace (Key,Value) pair from (Text, IntWritable) to (Text, Text)
