計算機はジョブスケジューラによって管理されています.
基本的なジョブの確認,投入方法は大型計算機利用マニュアルをご参照ください.
ジョブスクリプトの作成
コンパイル済みの実行ファイルをバッチジョブとして実行するには,ジョブスケジューラに渡すジョブスクリプトが必要です.
ジョブスクリプト
以下のページをご参照ください.
ログイン後,以下にサンプルファイルがあります.自分のディレクトリにコピーしてからご利用ください.
kagayaki: /Samples
ジョブの投入
・作成したジョブスクリプトを以下のようにジョブスケジューラに投入します.
% qsub -q <キュークラス名> <ジョブスクリプト>
・ジョブの開始/終了時にメール通知をしたい場合は以下のようにジョブを投入します.
% qsub -q <キュー名> -M <mail address> -m be <ジョブスクリプト名>
-M <メールのあて先>
-m be [b -> begin(ジョブ開始) , e -> end(ジョブ終了)]
・ジョブ削除を削除したい場合は以下のよう行います.
なお、ジョブの所有者以外は実行できません.
% qdel <Job id>
キュークラス
シングルノード向け: (デフォルトチャンク:16CPU+64GB)
クラス | ノード数 | コア数 | メモリ | 実行時間 | 同時実行ジョブ数 | 同時実行ジョブ数/1ユーザ |
---|---|---|---|---|---|---|
TINY | ~1/8node | ~16core | ~64GB | 30min | 90job | 16job |
DEFAULT | ~1/2node | ~64core | ~256GB | 1week | 300job | 15job |
SINGLE | ~1node | ~128Core | ~512GB | 1week | 150job | 10job |
LONG | ~1node | ~128COre | ~512GB | 3week | 30job | 2job |
マルチノード向け:(デフォルトチャンク:1ノード/128CPU+512GB)
クラス | ノード数 | コア数 | 実行時間 | 同時実行ジョブ数 | 同時実行ジョブ数/1ユーザ |
---|---|---|---|---|---|
SMALL | 1~6node | ~768Core | 1week | 50job | 7job |
LARGE | 6~16node | ~2048Core | 1week | 20job | 3job |
XLARGE | 16~32node | ~4096Core | 5day | 7job | 1job |
X2LARGE | 32~64node | ~1664Core | |||
LONG-L | 1~5node | ~640Core | 2week | 10job | 1job |
- 通常,MPI等を利用しない場合はジョブのマルチノード化はできません
(ジョブは正常に開始しますが,実際の計算はシングルノード内のみで実行されます)
GPUノード:
クラス | ノード数 | GPU数 | GPU | 実行時間 | 同時実行ジョブ数 | 同時実行ジョブ数/1ユーザ |
---|---|---|---|---|---|---|
GPU-1 | 0.5node | 1 | NVIDIA A40 | 7day | 30job | 4job |
GPU-S | 1node | 1-2 | NVIDIA A40 | 5day | 16job | 2job |
GPU-L | 1-4node | 1-8 | NVIDIA A40 | 3day | 2job | 1job |
GPU-1A | 0.5node | 1 | NVIDIA A100 | 7day | 20job | 2job |
GPU-LA | 1-4node | 1-8 | NVIDIA A100 | 3day | 2job | 1job
|
VMノード: *ジョブ実行時にVMオプションが必要です
クラス | ノード数 | GPU数 | GPU | 実行時間 | 同時実行ジョブ数 | 同時実行ジョブ数/1ユーザ |
---|---|---|---|---|---|---|
VM-CPU | 1node | 1 | - | 7day | - | 4job |
VM-GPU-S | 1node | 1/4 | NVIDIA H100 | 2day | - | 2job |
VM-GPU-L | 1node | 1 | NVIDIA H100 | 2day | - | 1job |
VM-LM | 1node | 1 | - | 7day | 1job | 1job |