Changes between Version 1 and Version 2 of HyperTable/BioInfo_Project


Ignore:
Timestamp:
Apr 17, 2008, 10:44:04 AM (16 years ago)
Author:
sunny
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • HyperTable/BioInfo_Project

    v1 v2  
    1 == Hypertable應用於BioInfo Project ==
     1= Hypertable應用於BioInfo Project =
     2
     3== 背景資料 ==
    24 * [http://trac.nchc.org.tw/grid/wiki/BioInfo_Project 陽明生物資訊合作計畫]
     5== 應用說明 ==
    36 * 以陽明的病人屬性分類資料為範本來建立搜尋引擎
    47  * 參考資料:
     
    1619    如果用Primary Site為Rowkey來搜尋"Breast",搜尋結果會查出所有Primary Site為"Breast"的資料[[BR]]
    1720   * NOTE: 交互比對的部份,Hypertable目前似乎沒提供,這個有可能要另外的程式再來處理過
     21== 資料表建置 ==
     22 * 編輯資料表綱要
     23{{{
     24$ vim gse.hql
     25CREATE TABLE GSEFamily (
     26  'Sample-iid',
     27  'Supplementary-Data',
     28  Description
     29);
     30}}}
     31 * 建立GSEFamily資料表
     32{{{
     33$ hypertable --batch < gse.hql
     34}}}
     35 * 透過轉檔程式產生GSEFamily.tsv
     36  * [http://trac.nchc.org.tw/grid/wiki/BioInfo_Project/2008-04-10 轉檔程式](windows)
     37{{{
     38C:\> GSEXmlParser.exe -f tsv -i GSE2109_family.xml -o GSEFamily.tsv
     39}}}
     40 * 匯入資料到GSEFamily資料表
     41{{{
     42$ load data infile "GSEFamily.tsv" into table GSEFamily;
     43}}}
     44 * 以Hql Command模式登入hypertable
     45{{{
     46$ hypertable
     47}}}
     48 * 搜尋資料
     49{{{
     50hypertable> select * from GSEFamily;
     51hypertable> select "Supplementary-Data" from GSEFamily;
     52hypertable> select "Sample-iid" from GSEFamily;
     53hypertable> select "Description" from GSEFamily;
     54}}}
     55 * 刪除資料
     56{{{
     57hypertable> delete * from GSEFamily where ROW="Breast";
     58}}}
     59
     60== Hadoop整合 ==