= 2009-10-04 = == Hadoop == * [http://www.cloudera.com/blog/2009/09/28/grouping-related-trends-with-hadoop-and-hive/ Grouping Related Trends with Hadoop and Hive] * 我覺得這篇是個很好的應用實例,拿 Wikipedia 的流量當輸入,總共有 320 GB。由於是 public 的資料,因此不會有所有權問題。 * [http://developer.amazonwebservices.com/connect/entry.jspa?externalID=2596 Wikipedia Page Traffic Statistics] - 範例資料 * [http://download.wikimedia.org/enwiki/ Wikipedia Database backup dumps] - 另一個資料來源 * [http://www.datawrangling.com/wikipedia-page-traffic-statistics-dataset Wikipedia Page Traffic Statistics Dataset] * [http://code.google.com/intl/zh-TW/edu/submissions/uwashington-scalable-systems/ University of Washington: Scalable Systems: Design, Implementation and Use of Large Scale Clusters] * [http://dumbotics.com/2009/03/15/computing-tf-idf-weights/ Computing TF-IDF weights] == Cloud Computing == * [http://www.csoonline.com/article/print/503778 5 Mistakes a Security Vendor Made in the Cloud] * 第一個錯誤:未告知使用者系統升級 - 連 Google 都犯過這種錯!! {{{ MISTAKE 1: Updating the SaaS product without telling customers or letting them opt out }}} * 第二個錯誤:無法回歸到前一個版本 - 一體兩面,採用雲端服務代表妳永遠可以用最新版,但或許使用者應該也有權利選擇穩定的舊版。這個問題不也在微軟身上發生過。 {{{ MISTAKE 2: Not offering a rollback to the last prior version }}} * 第三個錯誤:無法讓使用者選擇升級的時間點 - 嗯,Google 不會通知妳今天 gmail 要改版程式,確實有風險啦~ {{{ MISTAKE 3: Not offering customers a choice to select timing of an upgrade }}} * 第四個錯誤:無視前一版的設定將造成客戶使用上的不穩定 {{{ MISTAKE 4: New versions ignore prior configurations or settings, which creates instability in the customer environment }}} * 第五個錯誤:未能提供系統安全指標 - 就有點類似網路骨幹會要求 99.99% 的持續穩定運作率 {{{ MISTAKE 5: Not offering a safety valve }}} * [http://www.ithome.com.tw/itadm/article.php?c=57183 企業自建雲端運算的曙光] * 同樣的現象也出現在 Hadoop NYC {{{ 他感受到與去年最大的不同之處在於,去年多數人談論的議題仍是雲端運算這個名詞的由來、不同定義之間的差異、 以及技術上的實踐,然而,今年則有不少人已經跳脫名詞的辯證,而是在討論什麼樣的應用適合放在雲端運算平臺上。 多數企業臺灣都認可雲端運算技術的成熟,不同於過去質疑技術可行性,企業現在思考的重心是如何善用雲端運算創造商業價值。 -- 王宏仁 }}} * [http://www.ithome.com.tw/itadm/article.php?c=57182 趨勢揭露半年後推雲端專用伺服器] * 趨勢想轉行當系統整合(SI)廠了嗎??我個人是覺得任何典範的轉移,包含舊系統如何移轉到新的趨勢上都需要一定程度的能量,因此有硬體伺服器是不夠的。必須有廠商進入提供軟體整合服務,這樣類似的趨勢也可以從 Cloudera 推出 Cloudera Desktop 的舉動看得到。 {{{ 趨勢已經規畫了2款雲端運算伺服器,計畫在半年後先推出第一款名為Cloud Node的雲端運算伺服器, 是針對需要分析大量非結構化資料的商業智慧所設計。趨勢科技研發長張偉欽說,他們要讓Cloud Node就像是雲端運算系統的Excel一樣。 }}} * 趨勢所使用的軟體,我們團隊也多數都有涉略到。只是每一樣新科技都需要投注人力的,如何把一套軟體的精華內化到程式設計師的心裡,不僅要有教育訓練,要有相關的電腦叢書,還有花時間,才能讓現存的系統逐漸演化到雲端上啊!! {{{ 趨勢科技整合了自己用過的各項開源雲端技術,打包成一套隨插即用的雲端伺服器系統,包括像Xen虛擬化技術、KVM虛擬化系統、 Open Nebula虛擬機器部署技術、Hadoop平行運算技術、HyperTable分散式檔案系統、HBase分散式資料庫、Eucalyptus雲端系統等技術。 }}} * [[Image(http://www.ithome.com.tw/img/114/57106_1_1_l.jpg)]] * [[Image(http://www.ithome.com.tw/img/114/57106_1_2_l.jpg)]] * 台灣產業龍頭在雲端運算的自我定位 {{{ 中華電信副總經理李炎松表示:「中華電信會專注於PaaS(Platform as a Service)服務,打造綠色資料中心作為雲端服務的平臺。」 鼎捷系統集團技術長周忠信表示:「鼎新電腦會專注於SaaS(Software as a Service)服務,優先將不需大幅客製的軟體搬上雲端。」 廣達電腦副總經理張嘉淵表示:「看好雲端應用在健康照護、教育、電子監控、娛樂等四大產業的發展。」 → 看樣子現階段還是以硬體為主 趨勢科技全球研發長張偉欽表示:「趨勢將專注於開發軟體平臺,硬體則交由臺灣硬體廠商客製,已和廣達電腦洽談合作。」 }}} * [http://www.bnext.com.tw/?Mod=PrintArticle&Func=Notables&Id=556 新3C時代] {{{ 客服中心(call center)、資料中心(data center)和派遣中心(dispatch center)這3種C的快速發展, 將推動生產力再次提升。 客服人員不只是接聽電話,還能根據名單主動打電話出去,取代一部分銷售人員的工作。 租用外部資料中心的機房,儲存公司資訊和系統,降低管理難度和成本,是必然方向, 不管稱此為「雲端運算」(cloud computing)或資訊系統外包。 公司以「購買服務」取代「雇用」的比例勢必提高,不一定是為了降低成本,而是為了取得新的關鍵能力。 個人生產力的鬆綁,是每一次組織管理變革的前奏。 }}} * [http://www.linuxworld.com/cgi-bin/mailto/x_linux.cgi?pagetosend=/export/home/httpd/linuxworld/news/2009/092809-enterprise-search-a-different-ball.html&pagename=/news/2009/092809-enterprise-search-a-different-ball.html&pageurl=http://www.linuxworld.com/news/2009/092809-enterprise-search-a-different-ball.html&site=lw_general Enterprise Search: A different ball game for Google] - 看起來 Private Cloud / Hybrid Cloud 的商機也不小呢!! Google 推出企業搜尋(Enterprise Search),不僅必須要考慮安全問題,還要考慮存取權限的問題,看樣子要解決的問題還有很多。 * [http://www.tubechop.com/ TubeChop] - 幫忙剪輯 !YouTube 的網頁服務 * 相較於網路版的 !TubeChop ,那麼單機版的軟體呢?! 還蠻多套的,像是 [http://www.boilsoft.com/videosplitter/ Boilsoft Video Splitter] 或是 == Open Source == * [http://qerter.blogspot.com/2009/10/muttgmail-imap.html 使用 Mutt 收 GMail IMAP 電子郵件] - 我覺得比較有趣的是怎麼透過 DBUS 送訊息。 * [http://qerter.wiki.ptt.cc/-Mutt+Fetchmail+Msmtp+GnuPG Mutt Fetchmail Msmtp GnuPG] * [http://gnome-hacks.org/hacks.html?id=82 Notify from cronjob] 這篇有提到 DBUS_SESSION_BUS_ADDRESS 跟 notify-send 的用法 * notify-send 是包在 [http://packages.debian.org/libnotify-bin libnotify-bin] 套件中 * [http://code.google.com/intl/zh-TW/chromium/ Chromium] - Google Chrome 背後的開放原始碼瀏覽器專案 * 文字模式下的好工具 * [http://www.libthomas.org/~thomas/wp/?p=551 NAT底下 快速知道 真實 IP] {{{ html2text http://checkip.dyndns.org | grep “Current” | cut -c21-35 }}} * 螢幕擷圖 - [http://linuxtoy.org/archives/mastering-scrot.html scrot 從入門到精通] * [http://portable.easylife.tw/1779 Prozilla - Linux文字模式下多線下載工具] - flashget 聽過吧? [http://prozilla.genesys.ro/ Prozilla] 是文字模式底下的 flashget 啦!! == 生活 == * [http://www.cw.com.tw/article/print.jsp?id=37646 未婚女性不愛吃早餐,小心5大危機] {{{ 「金字塔型膳食組合」(Food Pyramid),一個正常的成年人,一天大概需要吃三到六碗的五穀根莖類、 三碟蔬菜、兩個水果、四份的蛋豆魚肉、一到兩杯的奶類和二、三匙的油脂。 早餐、午餐、晚餐的比例大約是30%、40%、30% 1. 先喝杯水 - 空腹喝下去的水,馬上被小腸吸收,五分鐘就能進入血液,讓血液流通更順暢。也有助於通便。 2. 其次吃水果或蔬菜 - 建議把水果列為早餐的第一道,因為空腹狀況下,身體可以完全盡情吸收水果的百般好處。 3. 五穀根莖類不能免 - 理想的總熱量來源應該有60%來自五穀雜糧類 4. 複合性醣類比單醣好 - 砂糖之類的單醣,雖然爆發力很強,能夠迅速提振精神,但是沒有後續力;          - 以複合性醣類為主的碳水化合物,因為夠逐漸釋放能量,使生理、心理的能量來源比較穩定 5. 最好選擇糙米、全麥 - 纖維的含量較高 6. 攝取奶類、蛋豆魚肉類 - 蛋白質中有兩種胺基酸,一種是「酪胺酸」,另一種是「色胺酸」。              - 當你想以「酪胺酸」來提昇心智時,應該先吃蛋白質豐富的食物,例如奶類、蛋豆魚肉類,再吃碳水化合物。 7. 醒腦小祕方 - 從事任何需要保持頭腦清醒的工作之前,最好吃一些低碳水化合物,高蛋白質的食物。 }}} * [http://www.cw.com.tw/article/print.jsp?id=35914 完美早餐3比例,吃得健康補腦力] {{{ 最完美的早餐必須含有三種比例: 主食類:比例約50%~60%,可食用小麥片、燕麥或貝果等 蛋白蛋:比例20%,可食用豆漿或牛奶等 油脂:取用來自果仁的健康油脂,例如杏仁或芝麻,比例30%。 1. 鮪魚蛋三明治不加美乃滋,配牛奶或豆漿 2. 麥片配豆漿,麥片可以選用芝麻、薏仁口味,五穀雜糧類的三合一沖泡包也可以。 3. 蔬菜水果餐、生菜沙拉餐可以偶而為之,視情況搭配御飯團或豆漿,補充蛋白質。 }}} * [http://www.cw.com.tw/article/print.jsp?id=39040 為何我沒錢?適合直接投資股票的4種基因] {{{ 四項重要的「股票投資獲利」特質(基因): 一、用主力,而非散戶的心態思考。 二、使用現金,不用融資。 三、有閒錢做投資。 四、有辦法做足功課。 }}} == 職場技能 == * [http://www.cw.com.tw/article/print.jsp?id=1996 大前研一:未來台灣創新的致勝關鍵] {{{ 一、轉變策略發現新需求(The strategic degree of freedom,SDF) - 「顧客到底在找什麼?」 - 企業想的是「如何製造出更好的相機」,消費者想的卻是「如何拍出更好的照片」。 二、運用套利概念創造優勢(Arbitrage) - 透過即時連線,人在大陸的中文老師就可以直接連線到日本授課,「套利」的結果,本土的語言老師就沒戲唱了。 三、新舊相加創造新組合(The new combination) - 手機上的網路拍賣平台 DeNA 四、將固定成本的貢獻極大化(Maximize the marginal contribution of fixed cost) - Lastminute.com 幫顧客規劃好所有旅遊需要的東西(機票、住宿、娛樂),顧客根本不必自己傷腦筋去找資料 五、發掘數位新大陸的大商機(Expand the digital continent) 六、快轉時鐘,遇見未來(Fast forward)- 山葉音樂學校(Yamaha)創辦人川上源一在日本很貧窮時,就預測日本會跟美國一樣愈來愈有錢,之後就會想要玩音樂 七、善用未被充分利用的東西(Utilize the under utilized) - 把目前利用率不高的東西拿來充分利用 - 當初的 i-mod,利用手機傳輸資料 八、運用線上即時活案例學習(Real-time online case study) - 在線上就目前活生生的企業做案例研究,把自己當成這家公司的執行長,針對它目前遇到的狀況,自己思考處理之道。 九、不斷地問「這代表什麼意思?」(What does this all mean?) - 不要只是一直埋首蒐集,要懂得適時停下來問自己:這些資訊代表什麼意思? 十、培養構想力(日文:Kousou ryoku) - 構想力是超越願景、超越概念的一種做法。 未來,台灣一定要趕上這「第四波」。 第一波是農業革命之後,澳洲跟阿根廷因此發達,澳洲產米的成本大概只有日本的二十分之一。 第二波是製造業的革命,這其中,中國太厲害了。 第三波是知識革命,我們看到印度因為電腦,而有強大的優勢。 }}}