Version 4 (modified by jazz, 14 years ago) (diff) |
---|
2010-11-24
Hadoop & GPFS
- IBM Builds on Hadoop with New Storage Architecture - IBM 讓 GPFS 可以跟 HDFS 合作,提供更高可用度的儲存服務。稱之為『General Parallel File System-Shared Nothing Cluster (GPFS-SNC)』
- IBM發表新儲存架構 GPFS-SNC
Public Large Data Set 公用大型資料集
- 維基百科 - http://en.wikipedia.org/wiki/Wikipedia:Database_download
- 亞馬遜提供的公用資料 - http://aws.amazon.com/publicdatasets/
- 包括基因資料(Genome, Ex. 1000 Genome Project)
- http://www.statmt.org/europarl/
- http://www.opendatacenteralliance.org/
- Data.gov - 美國公部門的資料 - 台灣應該可以上 檔案管理局 (2010-11-08)