Changes between Version 9 and Version 10 of MR_manual


Ignore:
Timestamp:
Jun 13, 2008, 3:40:33 PM (16 years ago)
Author:
waue
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • MR_manual

    v9 v10  
    3232
    3333 === 1.4 HBase ===
     34HBase是Hadoop中的一個簡單數據庫。它與Google的Bigtable特別相似。[[BR]]
     35HBase數據庫使用了和Bigtable非常相似的數據模型。用戶在表格里存儲許多數據行。每個數據行都包括一個可排序的關鍵字,和任意數目的列。表格是稀疏的,所以同一個表格里的行可能有非常不同的列,只要用戶喜歡這樣做。[[BR]]
     36列名是「<族名>:<標籤>」形式,其中<族名 >和<標籤>可以是任意字符串。[[BR]]
     37一個表格的<族名>集合(又叫「列族」集合)是固定的,除非你使用管理員權限來改變表格的列族。不過你可以在任何時候添加新的<標籤>。HBase在磁盤上按照列族儲存數據,所以一個列族裡的所有項應該有相同的讀/寫方式。[[BR]]
     38寫操作是行鎖定的,你不能一次鎖定多行。所有對行的寫操作默認是原子的。[[BR]]
     39所有數據庫更新操作都有時間戳。HBase對每個數據單元,只存儲指定個數的最新版本。客戶端可以查詢「從某個時刻起的最新數據」,或者一次得到所有的數據版本。
     40[http://tech.ccidnet.com/art/5833/20080318/1393525_1.html adapted from 詳細講解HBase]
    3441 == 二、環境設定 ==
    3542 == 三、執行 ==