Changes between Version 23 and Version 24 of jazz/Hadoop_Lab2


Ignore:
Timestamp:
Mar 24, 2009, 2:24:36 PM (15 years ago)
Author:
waue
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • jazz/Hadoop_Lab2

    v23 v24  
    2424 
    2525 === 1.3 下載HDFS的資料到本地目錄 ===
     26
    2627 * 下載
    2728{{{
     
    3536
    3637 === 1.4 刪除檔案 ===
     38
    3739{{{
    3840/opt/hadoop$ bin/hadoop fs -ls input
     
    4042}}}
    4143 === 1.5 直接看檔案 ===
     44
    4245{{{
    4346/opt/hadoop$ bin/hadoop fs -ls input
     
    4649
    4750 === 1.6 更多指令操作 ===
     51
    4852{{{
    4953hadooper@vPro:/opt/hadoop$ bin/hadoop fs
     
    103107 * grep 這個命令是擷取文件裡面特定的字元,在Hadoop example中此指令可以擷取文件中有此指定文字的字串,並作計數統計
    104108 
    105  {{{
     109{{{
    106110 /opt/hadoop$ bin/hadoop jar hadoop-*-examples.jar grep input grep_output 'dfs[a-z.]+'
    107  }}}
     111 
     112}}}
    108113 
    109114 運作的畫面如下:
    110115 
    111  {{{
     116{{{
    112117
    11311809/03/24 12:33:45 INFO mapred.FileInputFormat: Total input paths to process : 9
     
    13814309/03/24 12:34:22 INFO mapred.JobClient:   Job Counters
    139144......
    140  }}}
    141  }}}
     145}}}
     146
    142147 
    143148 * 接著查看結果
    144  {{{
     149
     150{{{
    145151  /opt/hadoop$ bin/hadoop fs -ls grep_output
    146152  /opt/hadoop$ bin/hadoop fs -cat grep_output/part-00000
    147  }}}
     153}}}
     154
    148155 結果如下
    149  {{{
     156
     157{{{
    1501583       dfs.class
    1511593       dfs.
     
    1972051       dfs.web.ugi
    1982061       dfsmetrics.log
     207
    199208 }}}
     209
    200210 === 2.2 Hadoop運算命令 WordCount ===
    201211