Changes between Version 5 and Version 6 of jazz/12-06-02


Ignore:
Timestamp:
Jun 3, 2012, 12:37:09 PM (12 years ago)
Author:
jazz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • jazz/12-06-02

    v5 v6  
    48484
    4949}}}
     50 * 那有沒有方法可以增加 Kernel Page Size 呢?目前核心有 hugetlbpage 的支援。
     51 * [參考] [http://www.mjmwired.net/kernel/Documentation/vm/hugetlbpage.txt Linux 核心文件 : hugetlbpage] - 讓 i386 架構支援 4K 與 4M (2M in PAE mode) page sizes 的模組。
    5052 * 結論(3):'''除了加大 Block Size 之外,最常用的方式是啟動 read ahead (運用快取來提昇硬碟循序讀取的效率)'''
    5153  * [參考四] [http://forums.opensuse.org/forums/english/get-technical-help-here/install-boot-login/437078-changing-pagesize-kernel.html#post2152312 Changing PAGESIZE in kernel]
     
    107109    XFS - SGI's second generation file system.[2]
    108110}}}
     111
     112== Hadoop & OCR ==
     113
     114 * 在 Hadoop 課程中會介紹到一個應用案例「紐約時報用一天的時間在 100 台 EC2 上透過 Hadoop 進行 TIFF 檔轉成 PDF 的 OCR 工作」。然而並沒有實際的程式碼或者範例可以看。今天看到一套 Open Source 可以在 Linux 上運作的 OCR 軟體,名為「[http://code.google.com/p/tesseract-ocr/ tesseract-ocr]」。想必在英文語系中,透過這一套軟體可以很輕易辦到英文的大量圖檔辨識。
     115 * 專案首頁:http://code.google.com/p/tesseract-ocr/
     116 * An OCR Engine that was developed at HP Labs between 1985 and 1995... and now at Google.
     117 * Debian 套件:http://packages.debian.org/tesseract
     118
     119== ttysnoop ==
     120
     121 * [http://daydreamer.idv.tw/rewrite.php/read-64.html ttysnoop-沒有螺絲起子的日子]
     122 * [http://www.linuxhelp.net/guides/ttysnoop/ DJG's ttysnoop Guide]
     123 *
     124