= 2010-04-24 = == ODSC.TW 2010 == * 09:00–09:50 nosql cassandra - Gasol (Pixnet) * http://cassandra.apache.org/ * 具備副本機制,優先存在記憶體中,後續寫入 commit log 中。採取完全平等的分散式架構,沒有 Hadoop !NameNode 單點失效問題(Single Point of Failure) * [http://en.wikipedia.org/wiki/CAP_theorem CAP theorem] - Consistency(一致性), Availibility(可用性),Partition Tolerance(容錯性)三個勢必要犧牲其中一個!! * 10:10–11:00 The Future of JavaScript. I mean ECMAScript - Douglas Crockford (Yahoo!) * IE 6 用戶消褪得很慢 -> IE6 MUST DIE!! * JavaScript has become the world's virtual machine!! * 支援 thread ?? * 格外應該重要的點:安全性,如何避免 XSS 跨站存取(1995年就提出,可是到目前為止沒有太多預防的進展),一旦可以跨站存取,駭客就可以觀察使用者的 DOM,可以做 SQL Injection Attack,並傳送資訊到全世界。瀏覽器並無法預防這些安全問題,因為本來就設計成可以瀏覽不同來源的內容,網頁標準也很難去避免這些安全問題。像 Mashup 本身就是一種 self-inflicted XSS attack。 * Safe JavaScript Subset * Caja - http://code.google.com/p/google-caja/ * HTML5 讓事情更複雜,允許更多攻擊,包含本地端的資料庫。 * 11:10–12:00 Upcoming improvements for HBase - Andrew Purtell (Trend Micro) * Big Data -> Medium Data 都需要 * Cloud Computing - Scale Free * Disk Seek time remains nearly constant -> Index(B-Tree), Seek (RMDB) 慢!! * No distributed transactions, no complex locking, no waits or deadlocks * 不要用 Spreadsheet 的想法看待 HBase, 或許可以用 Tag 的想法去看待它。 * HBase 跟 !BigTable 都是 CP 架構(注重 Consistancy 與 Partition Tolerance,根據 CAP Theorem 因此無法確保 Avaibility,寧可服務中斷也要資料正確!!) * HDFS-200 (working append) 將在 HBase 0.20.5 加入支援資料持續遞增的功能。 * ACID ? - [http://en.wikipedia.org/wiki/ACID atomicity, consistency, isolation, durability] * 新功能: * 跨資料中心備份 - 透過 Log Ship * 安全性強化 - 支援 authentication, authorization,Yahoo! 寫了很多新的安全性支援,包括 Kerberos 認證、Data isolation at the HDFS layer、Secure RPC。因此必須新增角色來作存取控管(Access Control Role) * Coprocessor - 靈感來自於 !BigTable 的新功能 Coprocessor,加入 !RegionObservor (需要再花點時間看清楚用途!!) * 01:30–02:20 Less is more - gugod * 維持 API 一致性可以減少程式設計者查閱文件與撰寫文件的時間 * 用字精簡、以簡馭繁、寫少作多 - jQuery, Ruby 都有這種特性 * 02:30–03:20 The introduction of Cloud Operating Platform Technology - 吳政學(trend) * 騰雲計算的雲端作業平台 - Tao Elaster - GPL2 Release * TCloud * 佈署工具:推薦[https://fedorahosted.org/cobbler/ cobbler]、[http://www.puppetlabs.com/ puppet] * Storage - 強調 [http://ceph.newdream.net/ Ceph] - 因為已經[http://ceph.newdream.net/2010/03/client-merged-for-2-6-34/ 被納入 Linux Kernel 2.6.34 了] * Open Source - VM Management - ConVirt (XenMan), Enomaly, Entropy, Eucalyptus, Google Ganeti, OpenNebula, Ovirt, Libvirt * Monitor: Nagios, RRD Tool, Ganglia, Heartbeat, Open vSwitch, SNMP * Storage: GlusterFS, XtreemFS, GFS, Luster, Fuse, Ceph, HDFS, DRBD * Deployment/config: DNSMasq, Cobbler, Puppet, KickStart, YUM * Computing: Hadoop, Hbase, HDFS, Map-Reduce, ZooKeeper, Cascading == NoSQL : HBase == * 最近 waue 在投影片中用到一張新的 !MapReduce 圖,今天再次在 Andrew 的演講中看到,出處是 Lars George 的部落格『[http://www.larsgeorge.com/2009/05/hbase-mapreduce-101-part-i.html HBase MapReduce 101 - Part I]』 * [[Image(http://1.bp.blogspot.com/_Cib_A77V54U/ShJ8K99N0fI/AAAAAAAAACY/aFbcbtIK4nI/s400/MapReduce2.png)]] * [http://www.larsgeorge.com/2010/02/fosdem-2010-nosql-talk.html FOSDEM 2010 NoSQL Talk] * [http://fosdem.org/2010/schedule/tracks/nosql FOSDEM NoSQL session] * [http://www.larsgeorge.com/2009/03/hbase-vs-couchdb-in-berlin.html HBase vs. CouchDB in Berlin] * MongoDB, CouchDB, HBase, Cassandra, Hypertable 趨勢觀察 * [[Image(mongodb_couchdb_hbase_cassandra_hypertable.png,width=800)]] == Embedded == * [http://packages.debian.org/experimental/multistrap multistrap] - A debootstrap replacement with multiple repository support, using apt to handle all dependency issues and conflicts. * Unlike debootstrap, multistrap relies on working versions of dpkg and apt outside the final filesystem. Multistrap supercedes emdebian-rootfs and includes support for preparing root filesystems for specific machines and variants.