| 1 | {{{ |
| 2 | #!html |
| 3 | <div style="text-align: center;"><big |
| 4 | style="font-weight: bold;"><big><big>Big Data之處理與分析實務班</big></big></big></div> |
| 5 | }}} |
| 6 | [[PageOutline]] |
| 7 | |
| 8 | = 報名資訊 = |
| 9 | |
| 10 | * 詳[http://www.iiiedu.org.tw/ites/CBD.htm 資策會網站公告] |
| 11 | |
| 12 | = 課程目標 = |
| 13 | {{{ |
| 14 | #!text |
| 15 | 學習雲端運算之三大關鍵技術,及利用Hadoop之分散式檔案系統(HDFS)與MapReduce,快速建構 |
| 16 | 出雲端運算的執行環境和服務,並以實作方式讓學員了解如何透過Hadoop架構以進行雲端資料的大量 |
| 17 | 資料處理、分析與應用。 |
| 18 | }}} |
| 19 | |
| 20 | = 課程特色 = |
| 21 | |
| 22 | * 本課程屬於基礎觀念課程,不特別講解程式設計; |
| 23 | * 實作將採體驗式教學,亦即先透過指令剪貼方式,體驗一次操作,從體驗中驗證所學觀念。 |
| 24 | |
| 25 | = 適合對象 = |
| 26 | |
| 27 | * IT經理或系統網路部門主管 |
| 28 | * 專案經理、系統架構師或系統網路管理人員 |
| 29 | * 企業或技術決策人員 |
| 30 | * 對於私有雲端運算有興趣的人士 |
| 31 | |
| 32 | = 預備知識 = |
| 33 | |
| 34 | * 具 Linux 操作實務與 Java 程式語言基礎者尤佳。 |
| 35 | |
| 36 | = 課程日期 = |
| 37 | |
| 38 | * 104年01月10~11日 (週六/週日 白天9:30 ~17:30 ),共2天、計14小時 。 |
| 39 | |
| 40 | = 上課地點 = |
| 41 | |
| 42 | * 資策會數位教育研究所。 |
| 43 | * 位於捷運木柵線大安站斜對面(復興南路與信義路交叉口)。 |
| 44 | * 上課地點與教室之確認,以上課通知函為主。 |
| 45 | |
| 46 | = 課程內容 = |
| 47 | |
| 48 | * [raw-attachment:wiki:III150110:15-01-10_Big_Data_Hadoop_Ecosystem.pdf 完整版投影片] |
| 49 | |
| 50 | == '''2015-01-10(六)''' == |
| 51 | |
| 52 | || 上午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || |
| 53 | || 09:30~11:05 || 淺談巨量資料的趨勢、挑戰與因應對策 || [raw-attachment:wiki:III141129:part-1.pdf part-1] || || || |
| 54 | || 11:05~11:15 || 中場休息 || || || || |
| 55 | || 11:15~12:00 || 處理巨量資料的資訊架構與關鍵技術 || [raw-attachment:wiki:III141129:part-2.pdf part-2] || || || |
| 56 | || 12:00~13:00 || 午餐、午休 || || || || |
| 57 | || 下午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || |
| 58 | || 11:10~12:00 || 實作一:Hadoop 單機安裝 || || [wiki:III141129/Lab1 實作一][[BR]][wiki:III141129/Lab2 實作二] || || |
| 59 | || 13:00~14:20 || Hadoop 簡介:緣起與術語 || [raw-attachment:wiki:III141129:part-3.pdf part-3] || || || |
| 60 | || 14:20~15:30 || HDFS 觀念與指令解說 || [raw-attachment:wiki:III141129:part-4.pdf part-4] || || || |
| 61 | || 15:30~15:40 || 中場休息 || || || || |
| 62 | || 15:40~17:30 || 實作二:HDFS 操作實務 || || [wiki:III141129/Lab3 實作三][[BR]][wiki:III141129/Lab4 實作四] || || |
| 63 | |
| 64 | == '''2015-01-11(日)''' == |
| 65 | |
| 66 | || 上午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || |
| 67 | || 09:30~11:10 || MapReduce 簡介 || [raw-attachment:wiki:III141129:part-5.pdf part-5] || || || |
| 68 | || 11:10~11:20 || 中場休息 || || || || |
| 69 | || 11:10~12:20 || 實作三:MapReduce 範例操作 || || [wiki:III141129/Lab5 實作五][[BR]][wiki:III141129/Lab6 實作六] || || |
| 70 | || 下午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || |
| 71 | || 13:30~14:00 || Hadoop 相關專案(1) Hadoop Streaming || [raw-attachment:wiki:III141129:part-6.pdf part-6] || || || |
| 72 | || 14:00~14:25 || 實作五:Hadoop Streaming 操作練習 || || [wiki:III141129/Lab7 實作七][[BR]][wiki:III141129/Lab8 實作八] || || |
| 73 | || 14:25~14:35 || 中場休息 || || || || |
| 74 | || 14:35~15:30 || Hadoop 相關專案(2) - Pig || [raw-attachment:wiki:III141129:part-7.pdf part-7] || || 1.[http://stackoverflow.com/questions/10942739/a-way-to-read-table-data-from-mysql-to-pig 將 Pig 運算結果透過 DBStorage 存到 MySQL 資料庫] [[BR]] 2. [http://sublogical.blogspot.tw/2011/10/cross-posted-from-my-company-blog-post.html 將 Pig 運算結果透過 HBaseStorage 存到 HBase 資料庫] [[BR]] 3. [http://blog.mortardata.com/post/61678005593/xml-pig-loader Pig 拿 XML 當輸入] || |
| 75 | || 15:30~16:00 || 實作六:Pig Latin 操作練習 || || [wiki:III141129/Lab9 實作九] || || |
| 76 | || 16:00~16:10 || 中場休息 || || || || |
| 77 | || 16:10~17:30 || HBase 操作觀察 || || [wiki:III141129/Lab10 實作十] || 1.關於 NoSQL 的選擇依據 - [wiki:NCHCCloudCourse100928#補充資料 YCSB] [[BR]] 2. [http://nosql-database.org/ NoSQL 的種類] [[BR]] 3. [http://www.infoq.com/news/2011/04/newsql NoSQL vs NewSQL] || |
| 78 | |
| 79 | = 參考書目 = |
| 80 | |
| 81 | 1. [http://lintool.github.com/MapReduceAlgorithms/MapReduce-book-final.pdf Data-Intensive Text Processing with MapReduce] (PDF),[http://www.umiacs.umd.edu/~jimmylin/book.html Jimmy Lin, University of Maryland] |
| 82 | |
| 83 | = 參考資料 = |
| 84 | |
| 85 | * [http://trac.3du.me/cloud/wiki/NCHCCloudCourse100928_MYSQL Hadoop 與 RDBMS 的支援] |
| 86 | * [raw-attachment:wiki:jazz/hidoop:12-07-24_hiCloud_Hadoop.pdf 運用 hiCloud 搭建 Hadoop 叢集] |
| 87 | |
| 88 | * Hadoop 常見應用領域: |
| 89 | * [http://www-304.ibm.com/easyaccess/fileserve?contentid=217007 Data Intensive Analytics with Hadoop: A Look Inside] |
| 90 | * [http://www.youtube.com/watch?v=fVL93-OF1gc Using Hadoop to fight spam in Yahoo! Mail] - 雅虎信箱 |
| 91 | * 商業智慧 |
| 92 | * http://www.pentaho.com/ - Pentaho 這間 BI 公司是 Hadoop 技術的長期支持者 |
| 93 | * 金融業 |
| 94 | * 2010-10-12 : VISA 採用 Hadoop 做風險評估 - [http://www.slideshare.net/cloudera/hw09-large-scale-transaction-analysis HadoopWorld 2009 : Large Scale Transaction Analysis] |
| 95 | * 中國信託 |
| 96 | * 電信業 |
| 97 | * 2011-06-12 : [http://www.ithome.com.tw/itadm/article.php?c=68023 中華電信用Hadoop技術分析通話明細] |
| 98 | * 人力資源 |
| 99 | * [http://www.simplyhired.com/a/jobtrends/trend/q-xen%2C+hyper-v%2C+hbase%2C+hadoop SimplyHired 就業技能調查排行榜] |
| 100 | * [http://www.indeed.com/jobtrends?q=xen%2C+hyper-v%2C+hbase%2C+hadoop&l= Indeed 就業技能調查排行榜] |
| 101 | * 行銷趨勢 |
| 102 | * [http://www.eland.com.tw/solutions/opview_insight 意藍科技 雲端服務 OpView 品牌口碑雷達] - ([http://www.eland.com.tw/news/news/20100506 2010-05-06]) |
| 103 | * [http://www.i-buzz.com.tw/index.asp i-Buzz網路口碑研究中心] |
| 104 | * 科學教育 |
| 105 | * 生資 |
| 106 | * [http://www.slideshare.net/mndoci/hadoop-for-bioinformatics Hadoop for Bioinformatics] |
| 107 | * [http://cloudcomputing.sys-con.com/node/1869333 The Future of Hadoop in Bioinformatics] |
| 108 | * [http://abhishek-tiwari.com/2010/08/mapreduce-and-hadoop-algorithms-in-bioinformatics-papers.html Mapreduce and Hadoop Algorithms in Bioinformatics Papers] |
| 109 | * 統計 |
| 110 | * [https://mpi-inf.mpg.de/~rgemulla/publications/das10ricardo.pdf Ricardo: Integrating R and Hadoop] |
| 111 | * [http://www.rhipe.org RHIPE: R and Hadoop Integrated Programming Environment] |