ジョブ投入
PCクラスタはジョブスケジューラによって管理されています.
基本的なジョブの確認,投入方法は大型計算機利用マニュアルをご参照ください.
ジョブスクリプトの作成
コンパイル済みの実行ファイルをバッチジョブとして実行するには,ジョブスケジューラに渡すジョブスクリプトが必要です.
ジョブスクリプト
以下のページをご参照ください.
また,pccログイン後,以下にサンプルファイルがあります.自分のディレクトリにコピーしてからご利用ください.
pcc: /work/Samples
ジョブの投入
・作成したジョブスクリプトを以下のようにジョブスケジューラに投入します.
% qsub -q <キュークラス名> <ジョブスクリプト>
・ジョブの開始/終了時にメール通知をしたい場合は以下のようにジョブを投入します.
% qsub -q <キュー名> -M <mail address> -m be <ジョブスクリプト名>
-M <メールのあて先>
-m be [b -> begin(ジョブ開始) , e -> end(ジョブ終了)]
・ジョブ削除を削除したい場合は以下のよう行います.
なお、ジョブの所有者以外は実行できません.
% qdel <Job id>
キュークラス
シングルノード向け:
クラス | ノード数 | チャンク数 | コア数 | 実行時間 | 同時実行ジョブ数 | 同時実行ジョブ数/1ユーザ | 優先度 |
---|---|---|---|---|---|---|---|
TINY | 1node | 1~4 | ~32core | 30min | 24job | 1 | 1 |
SINGLE | 1node | 1~4 | ~32core | 1week | 90job | 16job | 2 |
LONG | 1node | 1~4 | ~32core | 3week | 12job | 3job | 2 |
GPU:
クラス | ノード数 | GPU数 | GPU | 実行時間 | 同時実行ジョブ数 | 同時実行ジョブ数/1ユーザ | 優先度 |
---|---|---|---|---|---|---|---|
GPU-1 | 0.5node | 1 | Tesla P100 | 3day | 16job | 3job | 1 |
GPU-S | 1node | 1-2 | Tesla P100 | 2day | 16job | 1job | 2 |
GPU-L | 2-8node | 3-16 | Tesla P100 | 1day | 2job | 1job | 2 |
Materials Studio専用:
クラス | ノード数 | チャンク数 | コア数 | 実行時間 | 同時実行ジョブ数 | 同時実行ジョブ数/1ユーザ | 優先度 |
---|---|---|---|---|---|---|---|
MatStudio | 0.25node | 1 | ~8core | 1week | 20job | 20job | 1 |
MS_Dmol3 | 0.25node | 1 | ~8core | 1week | 40job | - | 1 |
MS_castep | 0.25node | 1 | ~8core | 1week | 20job | - | 1 |
MS_Forcite | 1node | 1-4 | ~32core | 1week | 1job | 1job | 1 |
MS_Compass | 1node | 1-4 | ~32core | 1week | 1job | 1job | 1 |
MS_Amorphous | 1node | 1-4 | ~32core | 1week | 1job | 1job | 1 |
MS_Dftbplus | 1node | 1-4 | ~32core | 1week | 1job | 1job | 1 |
- MatStudioキューのみMaterials Studio Gatewayユーザ専用キューとなります.
- その他のキューに投入されたジョブは,各ライセンスが利用可能になるまで実行を待機します.
マルチノード向け:
- 通常,MPIを利用しない場合はジョブのマルチノード化はできません
(ジョブは正常に開始しますが,実際の計算はシングルノード内のみで実行されます)
クラス | ノード数 | チャンク数 | コア数 | 実行時間 | 同時実行ジョブ数 | 同時実行ジョブ数/1ユーザ | 優先度 |
---|---|---|---|---|---|---|---|
SMALL | 2node | 5~8 | ~64core | 3day | 16job | 4job | 2 |
MEDIUM | 3-8node | 9~32 | ~256core | 12hour | 4job | 2job | 2 |
LARGE | 9-16node | 33~64 | ~512core | 12hour | 2job | 1job | 3 |
申請キュー:
クラス | ノード数 | チャンク数 | コア数 | 実行時間 | 同時実行ジョブ数 | 同時実行ジョブ数/1ユーザ | 優先度 |
---|---|---|---|---|---|---|---|
LONG-L | ~node | - | - | (申請ベース) | - | - | - |