1-2. ジョブの確認
ジョブの確認. 1 (一覧)
現在そのシステムで動いているジョブ,実行待ちになっているジョブを一覧することができます.
% qstat [option]
以下のように表示されます.
例:
% qstat
Job id Name User Time Use S Queue
--------- ----------- ----------- -------- - -----
16.altix aims14 user1 00:15:30 R SINGLE
18.altix aims14 user1 03:21:03 R SMALL
26.altix airfoil barry 00:21:03 R SMALL
27.altix airfoil barry 21:09:12 R SMALL
28.altix myjob user1 0 Q SINGLE
29.altix tns3d susan 0 Q LARGE
30.altix airfoil barry 0 Q SINGLE
31.altix seq_35_3 donald 0 Q MEDIUM
- Job Id .... 一意に与えられるJob番号
- Name .... ジョブ名
- User .... ユーザ名
- Time Use .... ジョブが実行開始してからの時間
- S(tatus) .... ジョブの状態(R: 実行中,Q: 実行待ち, E: 終了処理中)
- Queue .... 投入されたキュー
ジョブの確認.2 (コメント)
ジョブコメントを確認できます.
ジョブがいつ実行開始したか,なぜ実行開始されないか等の情報が表示されます.
% qstat -s <Job id>
例:
% qstat -s 28
altix:
Req'd Req'd Elap
Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time
--------------- -------- -------- ---------- ------ --- --- ------ ----- - -----
28.altix user1 SINGLE myjob -- 1 1 8190mb 168:0 Q --
Not Running: User has reached queue SINGLE running job limit.
上記の例では,job id:28のジョブが同時に実行できるSINGLEジョブの,1ユーザごとの個数制限にかかるため,実行待ちとなっています.
ジョブの確認. 3 (その他のオプション)
詳細情報表示
% qstat -f <Job id>
過去履歴(2週間まで)
% qstat -x
ユーザ別表示
% qstat -u <user id>
ジョブの確認4. (メモリリソース)
ジョブの詳細情報を表示させることで,自分のジョブに実際に割り当てられたメモリリソースを確認することができます.
#100%正確なデータではありません.
#xc30はメモリ表示に対応しておりません.
%qstat -xf <job ID> | grep used.mem
メモリリソースが指定のキューサイズを超える場合にはエラーが返る,演算結果が空になるなどジョブが正常に終了しない場合があります.
ジョブが正常に動作しない場合はいちどメモリサイズを確認し,上限近くの値を取っているようであればワンサイズ大きめのキューへのジョブ投入をお試しください.
ジョブの確認. 5(VMノード)
VMキューの稼働状況は以下のように確認します
% qstat @kvm-pbs
過去履歴(2週間まで)
% qstat -x @kvm-pbs
ユーザ別表示
% qstat -u <user id> @kvm-pbs