Changes between Version 7 and Version 8 of jazz/09-06-26


Ignore:
Timestamp:
Jun 27, 2009, 11:01:08 AM (15 years ago)
Author:
jazz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • jazz/09-06-26

    v7 v8  
    1414  * Q3: 為何說雲端運算是『計算就資料』,格網運算是『資料就計算』呢?
    1515  * A3: 這是目前我們的觀察,以及技術實作上的差異(格網的 Globus 技術特性,雲端的 Hadoop 技術特性)。格網過去會採用 GridFTP 來搬運資料,因此縱使 Meta-Schedule 幫你找到計算資源,而你也已經排到排程,但還是要等資料搬好才可以作運算。而雲端運算是一開始資料上傳就被切割成細塊,同時備份三份隨機分布在不同主機上,因此排程器較容易地找到資料所在的計算節點進行運算。
    16   * A3.1: 以下是我個人的觀點:也因為生物資訊的計算特性,我個人認為生物資訊在雲端運算的切入點是蠻恰當的。生物資訊通常要上傳的資料都很大,
     16  * A3.1: 以下是我個人的觀點:也因為生物資訊的計算特性,我個人認為生物資訊在雲端運算的切入點是蠻恰當的。生物資訊通常要上傳的資料集(Dataset)都很大,也很需要確保資料的完整性與可靠度。運算特性又往往是不同輸入,相同計算邏輯的批次作業。因此,與雲端運算的諸多特性相當吻合。
    1717  * Q4: 為何說雲端運算是『即時性差』?
    1818  * A4: 這是相較於過去一些分散式運算(特別是分散式物件)的特性而言。因為目前雲端運算的技術(特別是Hadoop)主要還是以批次作業(Batch)為主,如果是串流式(Stream)的運算,或 Online Simulation 的模擬就不合適採用雲端運算。