= 2009-10-04 = == Hadoop == * [http://www.cloudera.com/blog/2009/09/28/grouping-related-trends-with-hadoop-and-hive/ Grouping Related Trends with Hadoop and Hive] * 我覺得這篇是個很好的應用實例,拿 Wikipedia 的流量當輸入,總共有 320 GB。由於是 public 的資料,因此不會有所有權問題。 * [http://developer.amazonwebservices.com/connect/entry.jspa?externalID=2596 Wikipedia Page Traffic Statistics] - 範例資料 * [http://download.wikimedia.org/enwiki/ Wikipedia Database backup dumps] - 另一個資料來源 * [http://www.datawrangling.com/wikipedia-page-traffic-statistics-dataset Wikipedia Page Traffic Statistics Dataset] * [http://code.google.com/intl/zh-TW/edu/submissions/uwashington-scalable-systems/ University of Washington: Scalable Systems: Design, Implementation and Use of Large Scale Clusters] * [http://dumbotics.com/2009/03/15/computing-tf-idf-weights/ Computing TF-IDF weights] == Cloud Computing == * [http://www.csoonline.com/article/print/503778 5 Mistakes a Security Vendor Made in the Cloud] * 第一個錯誤:未告知使用者系統升級 - 連 Google 都犯過這種錯!! {{{ MISTAKE 1: Updating the SaaS product without telling customers or letting them opt out }}} * 第二個錯誤:無法回歸到前一個版本 - 一體兩面,採用雲端服務代表妳永遠可以用最新版,但或許使用者應該也有權利選擇穩定的舊版。這個問題不也在微軟身上發生過。 {{{ MISTAKE 2: Not offering a rollback to the last prior version }}} * 第三個錯誤:無法讓使用者選擇升級的時間點 - 嗯,Google 不會通知妳今天 gmail 要改版程式,確實有風險啦~ {{{ MISTAKE 3: Not offering customers a choice to select timing of an upgrade }}} * 第四個錯誤:無視前一版的設定將造成客戶使用上的不穩定 {{{ MISTAKE 4: New versions ignore prior configurations or settings, which creates instability in the customer environment }}} * 第五個錯誤:未能提供系統安全指標 - 就有點類似網路骨幹會要求 99.99% 的持續穩定運作率 {{{ MISTAKE 5: Not offering a safety valve }}} * [http://www.bnext.com.tw/?Mod=PrintArticle&Func=Notables&Id=556 新3C時代] {{{ 客服中心(call center)、資料中心(data center)和派遣中心(dispatch center)這3種C的快速發展, 將推動生產力再次提升。 客服人員不只是接聽電話,還能根據名單主動打電話出去,取代一部分銷售人員的工作。 租用外部資料中心的機房,儲存公司資訊和系統,降低管理難度和成本,是必然方向, 不管稱此為「雲端運算」(cloud computing)或資訊系統外包。 公司以「購買服務」取代「雇用」的比例勢必提高,不一定是為了降低成本,而是為了取得新的關鍵能力。 個人生產力的鬆綁,是每一次組織管理變革的前奏。 }}} * [http://www.linuxworld.com/cgi-bin/mailto/x_linux.cgi?pagetosend=/export/home/httpd/linuxworld/news/2009/092809-enterprise-search-a-different-ball.html&pagename=/news/2009/092809-enterprise-search-a-different-ball.html&pageurl=http://www.linuxworld.com/news/2009/092809-enterprise-search-a-different-ball.html&site=lw_general Enterprise Search: A different ball game for Google] - 看起來 Private Cloud / Hybrid Cloud 的商機也不小呢!! Google 推出企業搜尋(Enterprise Search),不僅必須要考慮安全問題,還要考慮存取權限的問題,看樣子要解決的問題還有很多。 * [http://www.tubechop.com/ TubeChop] - 幫忙剪輯 !YouTube 的網頁服務 * 相較於網路版的 !TubeChop ,那麼單機版的軟體呢?! 還蠻多套的,像是 [http://www.boilsoft.com/videosplitter/ Boilsoft Video Splitter] 或是 == Open Source == * [http://qerter.blogspot.com/2009/10/muttgmail-imap.html 使用 Mutt 收 GMail IMAP 電子郵件] - 我覺得比較有趣的是怎麼透過 DBUS 送訊息。 * [http://qerter.wiki.ptt.cc/-Mutt+Fetchmail+Msmtp+GnuPG Mutt Fetchmail Msmtp GnuPG] * [http://gnome-hacks.org/hacks.html?id=82 Notify from cronjob] 這篇有提到 DBUS_SESSION_BUS_ADDRESS 跟 notify-send 的用法 * notify-send 是包在 [http://packages.debian.org/libnotify-bin libnotify-bin] 套件中 * [http://code.google.com/intl/zh-TW/chromium/ Chromium] - Google Chrome 背後的開放原始碼瀏覽器專案 * 文字模式下的好工具 * [http://www.libthomas.org/~thomas/wp/?p=551 NAT底下 快速知道 真實 IP] {{{ html2text http://checkip.dyndns.org | grep “Current” | cut -c21-35 }}} * 螢幕擷圖 - [http://linuxtoy.org/archives/mastering-scrot.html scrot 從入門到精通] * [http://portable.easylife.tw/1779 Prozilla - Linux文字模式下多線下載工具] - flashget 聽過吧? [http://prozilla.genesys.ro/ Prozilla] 是文字模式底下的 flashget 啦!! == 職場技能 == * [http://www.cw.com.tw/article/print.jsp?id=1996 大前研一:未來台灣創新的致勝關鍵] {{{ 一、轉變策略發現新需求(The strategic degree of freedom,SDF) - 「顧客到底在找什麼?」 - 企業想的是「如何製造出更好的相機」,消費者想的卻是「如何拍出更好的照片」。 二、運用套利概念創造優勢(Arbitrage) - 透過即時連線,人在大陸的中文老師就可以直接連線到日本授課,「套利」的結果,本土的語言老師就沒戲唱了。 三、新舊相加創造新組合(The new combination) - 手機上的網路拍賣平台 DeNA 四、將固定成本的貢獻極大化(Maximize the marginal contribution of fixed cost) - Lastminute.com 幫顧客規劃好所有旅遊需要的東西(機票、住宿、娛樂),顧客根本不必自己傷腦筋去找資料 五、發掘數位新大陸的大商機(Expand the digital continent) 六、快轉時鐘,遇見未來(Fast forward)- 山葉音樂學校(Yamaha)創辦人川上源一在日本很貧窮時,就預測日本會跟美國一樣愈來愈有錢,之後就會想要玩音樂 七、善用未被充分利用的東西(Utilize the under utilized) - 把目前利用率不高的東西拿來充分利用 - 當初的 i-mod,利用手機傳輸資料 八、運用線上即時活案例學習(Real-time online case study) - 在線上就目前活生生的企業做案例研究,把自己當成這家公司的執行長,針對它目前遇到的狀況,自己思考處理之道。 九、不斷地問「這代表什麼意思?」(What does this all mean?) - 不要只是一直埋首蒐集,要懂得適時停下來問自己:這些資訊代表什麼意思? 十、培養構想力(日文:Kousou ryoku) - 構想力是超越願景、超越概念的一種做法。 未來,台灣一定要趕上這「第四波」。 第一波是農業革命之後,澳洲跟阿根廷因此發達,澳洲產米的成本大概只有日本的二十分之一。 第二波是製造業的革命,這其中,中國太厲害了。 第三波是知識革命,我們看到印度因為電腦,而有強大的優勢。 }}}