Context Navigation

0506

Timestamp:: May 6, 2009, 2:58:14 PM (16 years ago)
Author:: waue
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

waue/2009/0506

-                      v1
+                      v2
 }}}
 [[PageOutline]]
+= 簡介 =
+ * Hive 是由facebook所捐贈給hadoop的項目
+ * 功能類似前一天測試的cloudbase
+ * 更簡便的一點是，Hive已經整合在Hadoop 0.19.1的版本內(但 0.20.0 卻又不見了)，幾乎不用特別座設定，並且也有提供自己的交互查詢模式，就不用特別在安裝其他東西了
+ * 感覺上操作起來有點像hbase ！！
+= 安裝 =
+= 測試 =
+[hadoop@gp1 bin]$ export HADOOP=/home/hadoop/hadoop-0.19.1
+[hadoop@gp1 bin]$ export HIVE_HOME=/home/hadoop/hadoop-0.19.1/contrib/hive/
+[hadoop@gp1 bin]$ cd $HIVE_HOME
+[hadoop@gp1 hive]$ bin/hive
+hive> CREATE TABLE pokes (foo INT, bar STRING);
+OK
+Time taken: 0.251 seconds
+hive> CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING);
+OK
+Time taken: 0.106 seconds
+hive> SHOW TABLES;
+OK
+invites pokes
+Time taken: 0.107 seconds
+hive> DESCRIBE invites;
+OK
+foo     int
+bar     string
+ds      string
+Time taken: 0.151 seconds
+hive> ALTER TABLE pokes ADD COLUMNS (new_col INT);
+OK
+Time taken: 0.117 seconds
+hive> ALTER TABLE invites ADD COLUMNS (new_col2 INT COMMENT 『a comment');
+OK
+Time taken: 0.152 seconds
+hive> LOAD DATA LOCAL INPATH 『./examples/files/kv1.txt' OVERWRITE INTO TABLE pokes;
+Copying data from file:/home/hadoop/hadoop-0.19.1/contrib/hive/examples/files/kv1.txt
+Loading data to table pokes
+OK
+Time taken: 0.288 seconds
+hive> LOAD DATA LOCAL INPATH 『./examples/files/kv2.txt' OVERWRITE INTO TABLE invites PARTITION (ds=』2008-08-15′);
+Copying data from file:/home/hadoop/hadoop-0.19.1/contrib/hive/examples/files/kv2.txt
+Loading data to table invites partition {ds=2008-08-15}
+OK
+Time taken: 0.524 seconds
+hive> LOAD DATA LOCAL INPATH 『./examples/files/kv3.txt' OVERWRITE INTO TABLE invites PARTITION (ds=』2008-08-08′);
+Copying data from file:/home/hadoop/hadoop-0.19.1/contrib/hive/examples/files/kv3.txt
+Loading data to table invites partition {ds=2008-08-08}
+OK
+Time taken: 0.406 seconds
+hive> INSERT OVERWRITE DIRECTORY 『/tmp/hdfs_out' SELECT a.* FROM invites a;
+Total MapReduce jobs = 1
+Starting Job = job_200902261245_0002, Tracking URL = http://gp1:50030/jobdetails.jsp?jobid=job_200902261245_0002
+Kill Command = /home/hadoop/hadoop-0.19.1/bin/hadoop job  -Dmapred.job.tracker=gp1:9001 -kill job_200902261245_0002
+map = 0%,  reduce =0%
+map = 50%,  reduce =0%
+map = 100%,  reduce =0%
+Ended Job = job_200902261245_0002
+Moving data to: /tmp/hdfs_out
+OK
+Time taken: 18.551 seconds
+hive> select count(1) from pokes;
+Total MapReduce jobs = 2
+Number of reducers = 1
+In order to change numer of reducers use:
+set mapred.reduce.tasks = <number>
+Starting Job = job_200902261245_0003, Tracking URL = http://gp1:50030/jobdetails.jsp?jobid=job_200902261245_0003
+Kill Command = /home/hadoop/hadoop-0.19.1/bin/hadoop job  -Dmapred.job.tracker=gp1:9001 -kill job_200902261245_0003
+map = 0%,  reduce =0%
+map = 50%,  reduce =0%
+map = 100%,  reduce =0%
+map = 100%,  reduce =17%
+map = 100%,  reduce =100%
+Ended Job = job_200902261245_0003
+Starting Job = job_200902261245_0004, Tracking URL = http://gp1:50030/jobdetails.jsp?jobid=job_200902261245_0004
+Kill Command = /home/hadoop/hadoop-0.19.1/bin/hadoop job  -Dmapred.job.tracker=gp1:9001 -kill job_200902261245_0004
+map = 0%,  reduce =0%
+map = 50%,  reduce =0%
+map = 100%,  reduce =0%
+map = 100%,  reduce =100%
+Ended Job = job_200902261245_0004
+OK
+Time taken: 57.285 seconds
+hive> INSERT OVERWRITE DIRECTORY 『/tmp/hdfs_out' SELECT a.* FROM invites a;
+Total MapReduce jobs = 1
+Starting Job = job_200902261245_0005, Tracking URL = http://gp1:50030/jobdetails.jsp?jobid=job_200902261245_0005
+Kill Command = /home/hadoop/hadoop-0.19.1/bin/hadoop job  -Dmapred.job.tracker=gp1:9001 -kill job_200902261245_0005
+map = 0%,  reduce =0%
+map = 50%,  reduce =0%
+map = 100%,  reduce =0%
+Ended Job = job_200902261245_0005
+Moving data to: /tmp/hdfs_out
+OK
+Time taken: 18.349 seconds
+hive>  INSERT OVERWRITE DIRECTORY 『/tmp/reg_5′ SELECT COUNT(1) FROM invites a;
+Total MapReduce jobs = 2
+Number of reducers = 1
+In order to change numer of reducers use:
+set mapred.reduce.tasks = <number>
+Starting Job = job_200902261245_0006, Tracking URL = http://gp1:50030/jobdetails.jsp?jobid=job_200902261245_0006
+Kill Command = /home/hadoop/hadoop-0.19.1/bin/hadoop job  -Dmapred.job.tracker=gp1:9001 -kill job_200902261245_0006
+map = 0%,  reduce =0%
+map = 50%,  reduce =0%
+map = 100%,  reduce =0%
+map = 100%,  reduce =17%
+map = 100%,  reduce =100%
+Ended Job = job_200902261245_0006
+Starting Job = job_200902261245_0007, Tracking URL = http://gp1:50030/jobdetails.jsp?jobid=job_200902261245_0007
+Kill Command = /home/hadoop/hadoop-0.19.1/bin/hadoop job  -Dmapred.job.tracker=gp1:9001 -kill job_200902261245_0007
+map = 0%,  reduce =0%
+map = 50%,  reduce =0%
+map = 100%,  reduce =0%
+map = 100%,  reduce =17%
+map = 100%,  reduce =100%
+Ended Job = job_200902261245_0007
+Moving data to: /tmp/reg_5
+OK
+Time taken: 70.956 seconds