Version 9 (modified by wade, 15 years ago) (diff) |
---|
Introduction
Portable Batch System (PBS) 主要用在 Job scheduling,主要的功能為分配計算 tasks。這裡所使用的 Tarque 是以 open PBS 為基礎建立的一套實作方法。
Components of Batch System
- Master node:
這個 node 會執行 pbs_server,用來接收、產生、管理及保護使用者的批次工作,它也可以根據系統的需求參與 tasks 執行。
- Submit/Interactive? nodes:
這些 nodes 會執行 pbs_sched,用來工作排程、資源分配及節點管理。這些 nodes 讓使用者作為管理他們工作量的入口點,透過這些 nodes,使用者可以送出或是追縱 jobs,此外,有些系統甚至會預留一些 nodes 來做 interactive,例如測試或是故障檢修用。
- Compute nodes:
這些 nodes 會執行 pbs_mon ,這些 nodes 就像可憐的驢子一樣默默的接收來自 pbs_server 交辦的批次工作,執行相關程式,最後將結果回傳給 pbs_server 。
- Resources:
包含 high-speed networks, storage systems, license managers, etc。
Install
- Environment:
- Virtual Machine:Sun xVM VirtualBox 1.6.0
- Operation System:Ubuntu 8.04 LTS
- PBS:Torque 2.3.3
- download:
wget http://www.clusterresources.com/downloads/torque/torque-2.3.3.tar.gz
- Extract and build:
tar zxvf torque-2.3.3.tar.gz cd torque-2.3.3 ./configure --prefix=/opt/torque-2.3.3 make make install
- ' configure: error: C compiler cannot create executables ' or ' C compiler cannot create executables '
sudo apt-get install libc6-dev
- ' configure: error: C compiler cannot create executables ' or ' C compiler cannot create executables '
Testing
$ echo "sleep 60; date" | /opt/pbs/bin/qsub $ /opt/pbs/bin/qstat
Reference
- 安裝相關
- Torque home page
- 友組推薦網站
- Queuing System, 吳長興, 國家高速網路與計算中心 2007 年度第一期教育訓練課程 CLUSTER/GRID 基礎研習營 p133-p164