- 活動名稱:Taiwan Hadoop Ecosystem Workshop 2014 Q1
台灣 Hadoop 生態系工作坊 2014 Q1 - 活動時間:2014/03/08 (六) 10:30~16:10
- 活動地點:關貿網路訓練教室 @ 南港軟體工業園區一期 E 棟七樓
(台北市南港區三重路 19-13 號,地圖 Map) - 報名網址:http://goo.gl/Yy1ZdD
- 活動名額:開放 60 名座位,依實際報到為準。
- 活動費用:本活動不收取費用,感謝關貿網路贊助場地。
- 交通資訊:搭乘捷運板南線,在「南港軟體園區站」下車,再步行約五分鐘,可到一期大門口。屆時一樓大門口與樓梯口會有立牌指引。
- 活動議程:
時段 | 講題 | 講者 |
---|---|---|
10:00-10:30 | 報到時間 | |
10:30-11:50 | Impala資料倉儲應用案例分享 | 陳俊光/李民祥/黃勁超 , 關貿網路 |
11:50-12:00 | 休息(午餐自理) | |
13:30-14:10 | SQL on HBase : Hare | 鄭紹志 , 亦思科技 |
14:10-14:50 | Network Traffic Search using Apache HBase | 葉祐欣 , 趨勢科技 SPN |
14:50-15:10 | 中場休息 | |
15:10-15:30 | [閃電講] 探討如何用 Mahout 分析網路流量 | Raymond , systw.net 站長 |
15:30-15:50 | [閃電講] Develop a game community mining system by big data technology | A-Len, Gamania |
15:50-16:10 | [新商業模式] 他山之石 - 從日誌蒐集到線上分析 - Live Demo: Treasure Data Cloud |
Jazz Wang, Etu |
- 時段:10:30 - 11:50
- 講題:Impala資料倉儲應用案例分享
- 講者:陳俊光 / 李民祥 / 黃勁超 , 關貿網路
- 摘要:
PART A: Why impala ? (20 min) 1. SQL on Hadoop 的需求 2. Impala 的介紹(發展歷程、架構、功能、特色) PART B: Impala在資料分析與資料倉儲(DW)的應用 (40 min) 1. DW (Before and After) 2. Impala 大數據資料倉儲 (應用架構, 用法:資料注入與轉換 等) 3.購物籃分析實例為例與 Demo PART C: 分享與總結 (20min ~) 1. 心得分享 2. 相關議題 3. Q&A; (Open Discussion)
- 11:50-12:00 午餐:自理
- 時段:13:30~14:10
- 講題:SQL on HBase : Hare
- 講者:鄭紹志 , 亦思科技
- 時段:14:10~14:50
- 講題:Network Traffic Search using Apache HBase
- 講者:葉祐欣 , 趨勢科技 SPN
- 14:50-15:10 中場休息
- 時段:15:10-15:30
- 講題:[閃電講] 探討如何用 Mahout 分析網路流量
- 講者:Raymond , systw.net 站長
- 摘要:
在資料量無限,計算資源有限的情況下,平常看網路流量頂多就是看那個 IP 的用量大,那個 IP 去那邊等,但是當計算資源可無限擴大並有現成 Data Mining 工具可用時,是時候來開始研究一下,如何應用在網路流量分析並看到更多有用的資訊。
- 時段:15:30-15:50
- 講題:[閃電講] Develop a game community mining system by big data tech.
- 講者:A-Len, Gamania
- 摘要:
遊戲產業是一個方向變動很快速的地方,以台灣而言,從 1990 年代左右,單機遊戲 -> Online Game -> Web Game -> APP ,才短短二十年時間,台灣人喜歡的遊戲產品就經歷了四次重大的目標轉換。是否我們有辦法利用 Big Data 的理念和技術,分析我們的顧客以至於去猜測下一階段會賺錢的產品呢? 分享給大家我這兩年來一些在公司實作的成果和想法。
- 時段:15:50-16:10
- 講題:[新商業模式] 他山之石 - 從日誌蒐集到線上分析
- Live Demo: Treasure Data Cloud - 講者:Jazz Wang, Etu
- 摘要:
過去我曾在一些場合演講過巨量資料的五大階段「蒐、存、取、析、用」。Etu 蔣居裕副總也用「生、流、存、算、用、看」六個階段來說明巨量資料的動態特徵。根據這幾年推動社群得到一個結論,大家已經知道可以用 Hadoop Ecosystem 來「存」、「取」、「析」。可是「生」、「流」、「蒐」該怎麼做呢?分析完以後該怎麼視覺化,產生應用呢?甚至產生了視覺化該怎麼「看」(解讀)呢?這次閃電講想跟大家分享一個「他山之石」,Treasure Data 是 Flunetd 背後的開發公司,他們最近主打一個雲端服務,稱為 Treasure Data Cloud,且讓我跟大家解析一下這背後可能的組成元素。
Last modified 11 years ago
Last modified on Apr 11, 2014, 10:55:19 PM