Project

General

Profile

その他問い合わせ #3420

Check job status(end) failedについて

Added by Anonymous 6 months ago. Updated 6 months ago.

Status:
回答中
Priority:
通常
Assignee:
-
Start date:
04/01/2020
Due date:
% Done:

0%

Estimated time:

Description

お世話になっております。

Job Manager:Ver 2.1.1を現在使用しております。

一部ジョブにて以下のメッセージが出力されジョブも異常停止となっておりました。
「Check job status(end) failed」

実行コマンドにtypeコマンドを設定し、値を取得しているジョブが4つほどあるのですが、
そのうちの1つだけ複数回発生しております。

過去の質問にもありましたが、
https://www.jobarranger.info/redmine/issues/1364

こちらの症状はバージョンアップすることで回避できますでしょうか。
その場合、バージョンいくつから対応されますでしょうか。

以上、よろしくお願い致します。

Updated by 保守サポート 担当 6 months ago

  • Status changed from 新規登録 to 回答中

ジョブアレンジャーのご利用ありがとうございます。

過去の質問にもありましたが、
https://www.jobarranger.info/redmine/issues/1364

こちらの症状はバージョンアップすることで回避できますでしょうか。
その場合、バージョンいくつから対応されますでしょうか。

ご利用バージョンが2.1.1であれば、過去の #1364 の件とは違うのでは、と思われます。
以下の情報を頂けますか。

・Agentログ
・環境情報(JAZServer、AgentのOS、DBバージョン等)

速やかな返信のためにサポート契約をご検討頂ければ幸甚です。

宜しくお願い致します。

Updated by Anonymous 6 months ago

情報が足らず申し訳ありません。

以下に情報を記載いたします

JAZサーバ:
OS:CentOS6.7
Job Arranger Server v2.1.1 (revision 6955) (2015-05-01)
mysql Ver 14.14 Distrib 5.6.26, for Linux (x86_64) using EditLine wrapper

Agent:
OS:Windows server 2003 R2 SP2

ログ
1468:20200311:070002.346 [INFO] In ja_job_object_list_executive () jobid: 928456, type: command, status: BEGIN
1468:20200311:070002.346 [INFO] jobid: 928456, status: 0
1468:20200311:070002.362 [ERROR] In ja_jobfile_chkend() process 50744 isn't existed
1468:20200311:070002.362 [ERROR] In ja_agent_end() Check job status(end) failed. jobid: 928456
1468:20200311:070003.378 [INFO] In ja_job_object_list_executive() jobid: 928456, status: END

以上、よろしくお願い致します。

Updated by 保守サポート 担当 6 months ago

情報のご提供ありがとうございます。

まずご利用のAgent:OS:Windows server 2003 R2 SP2 はAgentのサポート対象ではありません。
https://www.jobarranger.info/jaz/jaz_env.html

エラーについてです。

1468:20200311:070002.362 [ERROR] In ja_jobfile_chkend() process 50744 isn't existed
1468:20200311:070002.362 [ERROR] In ja_agent_end() Check job status(end) failed. jobid: 928456

このエラーは #1484 の#4で詳しい説明があるものと同様と思われます。

通常、処理結果はユーザーコマンドの終了後、ジョブエージェントのコマンド実行プロセスにより一時ファイルに格納され、
その一時ファイルとユーザーコマンドの終了をジョブエージェントの別プロセスである終了監視プロセスが監視しているのですが、
一時ファイルの遅延書き込みが発生すると、監視タイミングによりユーザーコマンドが終了しているにもかかわらず、
処理結果が出力されていないという状態が発生し、エラーとなってしまいます。

「ファイルの遅延書き込み」が発生の原因であり、同チケットの返信にも以下のようにありますが、Agentの負荷状況によって起き得ます。

サーバの負荷状況を確認したところ、CPU使用率が100%を振り切っており、メモリもスワップメモリを利用している状況であるため、書き込み遅延が発生し得る状況にあったと理解しています。

その後Version 2.1.0で対応しましたが、それ以降でも同一のWindowsAgentでの同時並行でジョブが実行される場合に稀に発生が報告されました。
Version3.4.2以降でさらに抜本的な改善が入っております。

現状でもAgentサーバの負荷状況を確認し、安定させられれば発生しなくなることは考えられますが、
先ずはAgentOSのversionアップ、そしてJAZのversionアップを推奨します。

以上よろしくお願いいたします。

Also available in: Atom PDF