menu

1-2. ジョブの確認

ジョブの確認. 1 (一覧)

現在そのシステムで動いているジョブ,実行待ちになっているジョブを一覧することができます.

% qstat  [option]


以下のように表示されます.

例:

% qstat

Job id   Name      User       Time Use S Queue
--------- ----------- ----------- -------- - -----
16.altix aims14    user1      00:15:30   R SINGLE
18.altix aims14    user1      03:21:03   R SMALL
26.altix airfoil      barry      00:21:03    R SMALL
27.altix airfoil      barry      21:09:12    R SMALL
28.altix myjob     user1            0       Q SINGLE
29.altix tns3d     susan            0       Q LARGE
30.altix airfoil      barry            0       Q SINGLE
31.altix seq_35_3 donald           0        Q MEDIUM

  • Job Id ....   一意に与えられるJob番号
  • Name  ....   ジョブ名
  • User   ....   ユーザ名
  • Time Use .... ジョブが実行開始してからの時間
  • S(tatus) ....  ジョブの状態(R: 実行中,Q: 実行待ち,  E: 終了処理中)
  • Queue   ....   投入されたキュー

ジョブの確認.2 (コメント)

ジョブコメントを確認できます.
ジョブがいつ実行開始したか,なぜ実行開始されないか等の情報が表示されます.

% qstat -s <Job id>

例:

% qstat -s 28
altix:
                                                            Req'd  Req'd   Elap
Job ID          Username Queue    Jobname    SessID NDS TSK Memory Time  S Time
--------------- -------- -------- ---------- ------ --- --- ------ ----- - -----
28.altix     user1   SINGLE    myjob            --    1  1  8190mb 168:0 Q   --
   Not Running: User has reached queue SINGLE running job limit.

上記の例では,job id:28のジョブが同時に実行できるSINGLEジョブの,1ユーザごとの個数制限にかかるため,実行待ちとなっています.

ジョブの確認. 3 (その他のオプション)

詳細情報表示

% qstat -f <Job id>

過去履歴(2週間まで)

% qstat  -x

ユーザ別表示

% qstat -u <user id>

 

ジョブの確認4. (メモリリソース)

ジョブの詳細情報を表示させることで,自分のジョブに実際に割り当てられたメモリリソースを確認することができます. 
#100%正確なデータではありません.
#xc30はメモリ表示に対応しておりません.

%qstat -xf <job ID> | grep used.mem

メモリリソースが指定のキューサイズを超える場合にはエラーが返る,演算結果が空になるなどジョブが正常に終了しない場合があります.

ジョブが正常に動作しない場合はいちどメモリサイズを確認し,上限近くの値を取っているようであればワンサイズ大きめのキューへのジョブ投入をお試しください.