Changes between Version 10 and Version 11 of MR_manual


Ignore:
Timestamp:
Jun 13, 2008, 3:49:39 PM (16 years ago)
Author:
waue
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • MR_manual

    v10 v11  
    1515然而大規模分散式運算技術即為「雲端運算」的概念起源,未來如手機、GPS等行動裝置都可以透過雲端運算技術,發展出更多的應用服務。
    1616進一步的雲端運算不僅只做資料搜尋、分析的功能,未來如分析DNA結構、基因圖譜定序、解析癌症細胞等,都可以透過這項技術輕易達成。
    17 [http://zh.wikipedia.org/wiki/%E9%9B%B2%E7%AB%AF%E9%81%8B%E7%AE%97 adapted by wikipedia]
     17[http://zh.wikipedia.org/wiki/%E9%9B%B2%E7%AB%AF%E9%81%8B%E7%AE%97 copied by wikipedia]
    1818 === 1.3 Hadoop ===
    1919
     
    2929MapReduce是Google 的一項重要技術,它是一個編程模型,用以進行大數據量的計算。對於大數據量的計算,通常採用的處理手法就是並行計算。至少現階段而言,對許多開發人員來說,並行計算還是一個比較遙遠的東西。MapReduce就是一種簡化並行計算的編程模型,它讓那些沒有多少並行計算經驗的開發人員也可以開發並行應用。[[BR]]
    3030MapReduce的名字源於這個模型中的兩項核心操作:Map和 Reduce。也許熟悉Functional Programming(函數式編程)的人見到這兩個詞會倍感親切。簡單的說來,Map是把一組數據一對一的映射為另外的一組數據,其映射的規則由一個函數來指定,比如對[1, 2, 3, 4]進行乘2的映射就變成了[2, 4, 6, 8]。Reduce是對一組數據進行歸約,這個歸約的規則由一個函數指定,比如對[1, 2, 3, 4]進行求和的歸約得到結果是10,而對它進行求積的歸約結果是24。
    31 [http://www.cnblogs.com/wayne1017/archive/2007/03/18/668768.html adapted from Hadoop學習筆記一簡要介紹]
     31[http://www.cnblogs.com/wayne1017/archive/2007/03/18/668768.html copied from Hadoop學習筆記一簡要介紹]
    3232
    3333 === 1.4 HBase ===
     
    3838寫操作是行鎖定的,你不能一次鎖定多行。所有對行的寫操作默認是原子的。[[BR]]
    3939所有數據庫更新操作都有時間戳。HBase對每個數據單元,只存儲指定個數的最新版本。客戶端可以查詢「從某個時刻起的最新數據」,或者一次得到所有的數據版本。
    40 [http://tech.ccidnet.com/art/5833/20080318/1393525_1.html adapted from 詳細講解HBase]
     40[http://tech.ccidnet.com/art/5833/20080318/1393525_1.html copied from 詳細講解HBase]
    4141 == 二、環境設定 ==
    4242 == 三、執行 ==