2009-09-23
File System : lessfs : deduplication
- 先前一直有在注意 virtualization 所帶來的資料重疊問題,NetApp 在這方面就很厲害,可以從 File System 下手,把重複的檔案進行濃縮(deduplication)。今天剛好看到 Linux Magazine 的文章「Deduping Storage Depulication」,裡面有提到目前許多商業解決方案,但自由軟體呢?目前似乎只有用 FUSE 寫的 lessfs,它的官方網站 http://www.lessfs.com/ 目前並沒有太多資料,希望未來會有更多這類的檔案系統出現。我第一個想到的問題是在 loop device image 裡重複的檔案,該怎麼進行 deduplication 呢?? 同樣的 vmdk 這一些虛擬化的硬碟,有辦法作 deduplication 嘛??
- 2010-03-03 邀請 Sun 來演講 ZFS, 發現原來 ZFS 也有 deduplication 的特性呢!!真好!!
Virtualization
- Virtualization Makes Traditional Operating Systems Obsolete - 從開始研究虛擬化之後,就有一種感覺,現在「OS 不再是 OS」,「Hypervisor 本身就已經是個微型的 OS 或該稱之為 BIOS 呢??」。研究雲端運算之後,覺得「Browser 不再是 Browser」,反倒是「Browser 有點像新的 OS 可以拿來跑 Web Application」。回顧了關注很久的 CoreBoot (LinuxBIOS) 專案後更覺得「BIOS 不再是 BIOS」,如果把 Xen 或 KVM 擺到 LinuxBIOS 去 <1>,<2>,那現有的 OS 就變成只是一個 Client Application,隨你高興要開 Windows 還是另一個 Linux,那還需要 Windows 嘛?! Windows 變成有點像 Emulator,是為了跑以前的應用程式而存在。很有趣~
Cloud Computing
- 2008-08-26 看到的 The Virtual Computing Lab
- How it Works
- 原來 VCL 是 Apache 的育成專案(incubator),底層是基於先前看過的 xCAT - From Clusters To Clouds: xCAT 2 Is Out Of The Bag (09-01-26)
- 而 xCAT 2 (Extreme Cluster Administration Toolkit 2.x) 則是從 IBM 的 Cluster Systems Management (CSM) 演化而來
- 目前 VCL 的實機佈署(Physical (bare-metal) provisioning)使採用 xCAT
- 目前 VCL 的虛擬機器僅適用於 VMware ESXi, VMware ESX Standard server, VMware Free Server 的 Provision
- 雲端運算改變資訊科技市場形勢 - 轉載自香港信報研究部
- Bulletin of the Technical Committee on Data Engineering
- [論文] Building a Cloud for Yahoo!
- [論文] Implementation Issues of A Cloud Computing Platform
- http://www.icde2010.org/ - 26th IEEE International Conference on Data Engineering
Windows Azure
- Microsoft SQL Azure 初步介紹及申請(Cloud Computing, 雲端運算)
- Microsoft SQL Azure 連線方法(Cloud Computing, 雲端運算)
Linux
- SSH 免密碼登入
- 啟動 ssh-agent
~$ eval `ssh-agent -s`
- 將私密金鑰交給 ssh-agent 保管:ssh-add
~$ ssh-add
- 啟動 ssh-agent
- PuTTY 免密碼登入
- 先前有成功完成 PuTTYgen 的部分,有機會來試試看 Pageant 的做法。
Cluster Computing
- 從 Phantom Cluster 的架構圖中看到 psacct package,原來是可以拿來統計不同使用者登入登出跟執行指令的工具啊!!
NoSQL
- 從 Google Trends 的搜尋趨勢可以看到 SQLite > Google Gears > CouchDB 的趨勢,象徵著 distributed database 的影響力尚未普及。
- Anti-RDBMS: A list of distributed key-value stores - 列舉出一些分散式 key-value 資料庫,不過漏了
- 噗浪的lightcloud。
- redis - A persistent key-value database with built-in net interface written in ANSI-C for Posix systems
- CouchDB -
- Ubuntu couchdb 套件
- Debian couchdb 套件
- Modeling Entity Relationships in CouchDB
- couchdb-fuse - CouchDB FUSE File System
- [影片] Next Generation Data Storage with CouchDB (speaker: Jan Lehnardt) - Part 1
- [影片] Next Generation Data Storage with CouchDB (speaker: Jan Lehnardt) - Part 2
- [影片] MapReduce vs MySQL (speaker Stu Hood) - Part 1
- [影片] MapReduce vs MySQL (speaker Stu Hood) - Part 2
- [影片] MapReduce vs MySQL (speaker Stu Hood) - Part 3
- 在看維基百科的時候,發現 CouchDB 同時被分屬在 Column-oriented DBMS 跟 Document-oriented database
- Interactive CouchDB - 這裡用 Java Script 示範了 CouchDB 結合不同用途的 MapReduce 實作。
- dot.Cloud - an open-source cloud federation platform. - 從 Feature 看起來頗 Powerful
- Keep your servers under revision control
- Stop worrying about maintaining state: just create and kill instances
- Use tools you know: rsync, mercurial/git, ssh
- Push a small upgrade to your images without moving gigabytes around
- Replicate multi-server setups in just one command
- Cleanly separate data (DB, logs, content) and code (OS, libraries, binaries, configuration)
- Map data volumes to any available storage (NAS, EBS, S3)
- Save bandwidth by delivering your app closer to the consumer
- gears-dblib - A simple abstraction on top of the Database object in Gears
- orient - NoSQL document database light, portable and fast. Supports ACID Tx, Indexes, asynch queries, SQL layer, clustering, etc
Programming Management : Continuous Integration (CI)
- 當紅炸子雞:Continuous Integration
- 類似的概念,其實這次 COSA 會員大會也有提到必須靠定期的測試才能避免軟體接近結案才進行大修改。
- 在 last.fm 的簡報中,則說他們採用敏捷式專案管理(Agile Management)的 Scrum 管理法。
Web Service
- 關於 browscap 專案
- 從 再會了,CSS Hack 這篇文章看到的
browscap 是由 Microsoft 提出,藉由 Web Server 定期的自動更新一個叫 browscap.dll 的檔案, 讓程式可以從 Header 的 User Agent String 中對應出正確的 Browser 與 Operation System、以及其版本。
- 從 再會了,CSS Hack 這篇文章看到的
- MySQL to JSON - 能直接把 mysql_fetch_object 的結果變成 JSON
- [影片] Introduction to HTML 5 - Google 工程師簡介什麼是 HTML5
生活
- 補充水分你做對了嗎?上班族正確喝水有妙方
若水喝得不夠,身體容易偏酸性。 ●水對打造強健的骨骼有益。 ●水分充足的腦部,有助增強記憶力。 最好的喝水時間在早上起床後,幫助排除夜間積留在體內的毒素
Last modified 14 years ago
Last modified on May 18, 2010, 1:02:02 PM
Attachments (4)
- sqlite_gears.jpg (65.0 KB) - added by jazz 15 years ago.
-
cooper1.pdf
(72.0 KB) -
added by jazz 15 years ago.
[論文] Building a Cloud for Yahoo!
- experience_of_last.fm.png (70.2 KB) - added by jazz 15 years ago.
-
last.fm_irccat_bot.jpg
(54.2 KB) -
added by jazz 15 years ago.
last.fm 用 irc 的機器人(bot) 把 svn 的修改歷程送到 IRC 上,What a Good Idea!
Download all attachments as: .zip