{{{ #!html
時段 | 講題 | 講者 |
---|---|---|
10:00-10:30 | 報到時間 | |
10:30-11:50 | Impala資料倉儲應用案例分享 | 陳俊光/李民祥/黃勁超 , 關貿網路 |
11:50-12:00 | 休息(午餐自理) | |
13:30-14:10 | SQL on HBase : Hare | 鄭紹志 , 亦思科技 |
14:10-14:50 | Network Traffic Search using Apache HBase | 葉祐欣 , 趨勢科技 SPN |
14:50-15:10 | 中場休息 | |
15:10-15:30 | [閃電講] 探討如何用 Mahout 分析網路流量 | Raymond , systw.net 站長 |
15:30-15:50 | [閃電講] Develop a game community mining system by big data technology | A-Len, Gamania |
15:50-16:10 | [新商業模式] 他山之石 - 從日誌蒐集到線上分析 - Live Demo: Treasure Data Cloud |
Jazz Wang, Etu |
PART A: Why impala ? (20 min) 1. SQL on Hadoop 的需求 2. Impala 的介紹(發展歷程、架構、功能、特色) PART B: Impala在資料分析與資料倉儲(DW)的應用 (40 min) 1. DW (Before and After) 2. Impala 大數據資料倉儲 (應用架構, 用法:資料注入與轉換 等) 3.購物籃分析實例為例與 Demo PART C: 分享與總結 (20min ~) 1. 心得分享 2. 相關議題 3. Q&A (Open Discussion)
在資料量無限,計算資源有限的情況下,平常看網路流量頂多就是看那個 IP 的用量大,那個 IP 去那邊等,但是當計算資源可無限擴大並有現成 Data Mining 工具可用時,是時候來開始研究一下,如何應用在網路流量分析並看到更多有用的資訊。
遊戲產業是一個方向變動很快速的地方,以台灣而言,從 1990 年代左右,單機遊戲 -> Online Game -> Web Game -> APP ,才短短二十年時間,台灣人喜歡的遊戲產品就經歷了四次重大的目標轉換。是否我們有辦法利用 Big Data 的理念和技術,分析我們的顧客以至於去猜測下一階段會賺錢的產品呢? 分享給大家我這兩年來一些在公司實作的成果和想法。
過去我曾在一些場合演講過巨量資料的五大階段「蒐、存、取、析、用」。Etu 蔣居裕副總也用「生、流、存、算、用、看」六個階段來說明巨量資料的動態特徵。根據這幾年推動社群得到一個結論,大家已經知道可以用 Hadoop Ecosystem 來「存」、「取」、「析」。可是「生」、「流」、「蒐」該怎麼做呢?分析完以後該怎麼視覺化,產生應用呢?甚至產生了視覺化該怎麼「看」(解讀)呢?這次閃電講想跟大家分享一個「他山之石」,Treasure Data 是 Flunetd 背後的開發公司,他們最近主打一個雲端服務,稱為 Treasure Data Cloud,且讓我跟大家解析一下這背後可能的組成元素。