Project

General

Profile

Edit Actions

その他問い合わせ #3733

closed

前のジョブが完了する前に次のジョブが実行される

Added by Anonymous 6 months ago. Updated 1 day ago.

Status:
終了
Priority:
高め
Assignee:
-
Start date:
05/23/2024

Description

今回実行しているジョブネットは、複数のジョブを直列に接続しています。
ジョブネットの4番目のジョブ(ログと実行時刻からjobid: 9342と判断)が実行終了していないにもかかわらず、
ジョブネットの5番目のジョブ(ログと実行時刻からjobid: 9344と判断)が実行開始されています。
ジョブ実行コマンド側のログから、jobid: 9342が実行中にjobid: 9344を実行したため、jobid: 9342がエラーになっていることが判明しております。

Q1: 本現象の原因をご教示ください。
Q2: 本現象を今後発生させないための回避策をご教示ください。

【JobArrangerのバージョン】
Server: jobarg_server[Version 6.0.5.1 (revision 3175)] (RedHatEnterpriseLinux8.2で動作)
Agent: jobarg_agentd[6.0.5.1 (revision 3175)] (WindowsServer2019で動作)

【jobid: 9342 の変数値(一部)】
CURRENT_TIME 20240522111607
ICON_STATUS 2
JOBARG_MESSAGE Check job status(end) failed. jobid: 9342
JOBNET_BOOT_TIME 202405221112
JOB_EXIT_CD -1
MANAGEMENT_ID 715
SIGNAL 0


Files

jobarg_server.log (19 KB) jobarg_server.log Anonymous, 05/23/2024 12:40 PM
jobarg_agentd.log (124 KB) jobarg_agentd.log Anonymous, 05/23/2024 12:40 PM
jobarg_agentd.zip (63.1 KB) jobarg_agentd.zip Anonymous, 05/28/2024 01:20 PM
開発環境サーバ構成_20240607.png (34.5 KB) 開発環境サーバ構成_20240607.png Anonymous, 06/07/2024 11:33 AM
Actions #1

Updated by 保守サポート 担当333 6 months ago

  • Status changed from 新規登録 to 担当者処理中
  • Assignee set to 保守サポート 担当333

Updated by 保守サポート 担当333 6 months ago

Agent logで12:20:43 頃にメインプロセスID 3100 に関連するログがありますでしょうか。

また、ログがある場合連携していただくことは可能でしょうか。

Actions #3

Updated by 保守サポート 担当333 6 months ago

  • Assignee deleted (保守サポート 担当333)

Updated by Anonymous 5 months ago

Agent logで12:20:43 頃にメインプロセスID 3100 に関連するログがありますでしょうか。

Agent logとは、下記ディレクトリのファイルで認識合っておりますでしょうか。

C:\Program Files\Job Arranger\Job Arranger Agent\logs\jobarg_agentd.log

先日添付させていただいたjobarg_agentd.logは、発生日のみ切り出したログですので、発生日にコピーしていたjobarg_agentd.logを添付いたします。

「3100」でjobarg_agentd.logを検索したところ、以下の行が見つかりました。
ジョブを実行していたWindowsServer2019は、2024/05/21 21:02 に停止し、2024/05/21 21:17 に起動しております。

  3100:20240422:210024.183 [INFO] Job Arranger Agent shutdown requested

  3100:20240422:210025.197 [INFO] Job Arranger Agent stopped. Job Arranger 6.0.5.1 (revision 3175).

  3100:20240522:122043.125 [INFO] In ja_job_exec_end(), job id : 9342,total files read :2, process id : 2276 finished.
  3100:20240522:122043.159 [WARN] job response message:  the job is not running. inner_job_id: 9342, Server IP 10.110.4.15 
  3100:20240522:122043.160 [INFO] In ja_agent_send(), job id :9342 sent OK, job result sent to server IP 10.110.4.15,
  3100:20240522:122043.160 [INFO] In ja_agent_close() jobid: 9342 closed OK, status: 2, server ip : 10.110.4.15
  3100:20240522:122043.164 [INFO] In ja_jobfile_remove(),job id :9342's all data have been archived in close-folder.

  3100:20240522:161917.477 [INFO] In ja_chk_job_begin(), job status check starts. jobid : 9729
  3100:20240522:161917.477 [INFO] In ja_chk_job_begin(), job information exists.jobid :9729, folder_type :2
  3100:20240522:161917.478 [INFO] In ja_chk_job_begin(), jobid :9729 is currently executing. Skip check.
  3100:20240522:161917.478 [INFO] In ja_chk_job_begin(), job status check starts. jobid : 9747
  3100:20240522:161917.479 [INFO] In ja_chk_job_begin(), job information exists.jobid :9747, folder_type :2
  3100:20240522:161917.479 [INFO] In ja_chk_job_begin(), jobid :9747 is currently executing. Skip check.
  3100:20240522:161917.480 [INFO] In ja_chk_job_begin(), job status check starts. jobid : 9791
  3100:20240522:161917.480 [INFO] In ja_chk_job_begin(), job information exists.jobid :9791, folder_type :2
  3100:20240522:161917.481 [INFO] In ja_chk_job_begin(), jobid :9791 is currently executing. Skip check.

Updated by 保守サポート 担当314 5 months ago

Server側のログを確認していまして、JobArranger Server - JobArranger Agentの構成では、入ってこないはずの通知がAgentから入ってきているように見えています。

JobArranger Serverが、存在していないでしょうか?

Updated by Anonymous 5 months ago

開発中のシステムでは、JobArrangerに関するサーバは以下のようになっています。
  • JobArrangerServerがインストールされているサーバM
  • JobArrangerAgentがインストールされているサーバA,サーバB,サーバC,サーバF
本番環境としては上記のサーバ一式なのですが、以下の理由から開発環境用のサーバFは共通サーバとしており、複数開発環境からサーバFのジョブを実行しないように調整しています。
  • 開発体制の都合上、開発環境は複数存在する
  • サーバFは都合上、開発環境用に1台のみである

今回発生した事象は、サーバAにてジョブ実行を行ったときに発生しております。
サーバFに対してのジョブ実行が重複しなければ他のJobArrangerServerのジョブ実行に影響しない想定なのですが、認識誤りでしょうか。
また、認識誤りであれば、サーバFを共通サーバとして動作させる方法をご教示いただけますでしょうか。

Updated by 保守サポート 担当314 5 months ago

  • Status changed from 担当者処理中 to 回答中

JobArranger 6.0.4からDocker、クラスタ等で、ServerのIPが変更された際、自動的に調整する機能が追加されてます。
今回のケースは、このIP自動調整機能により、別のServerのIPが、移動先のIPとして認識されたものと思われます。

下記のページにServerIDパラメータがありますので、JobArranger ServerのConfiguraitonファイルを修正して再起動してください。
JobArranger Serverごとに、異なるServerIDを設定してください。
https://www.jobarranger.info/jpn/jaz/6.manual/index.html?tgt=/4.0/1.Install/1.JobArrangerServer/04.Configuration.php

Updated by Anonymous 5 months ago

回答ありがとうございます。再現方法が不明のため確認できませんが、ServerID設定の対応をさせていただきます。

Updated by 保守サポート 担当314 1 day ago

  • Status changed from 回答中 to 終了

更新が無いので、クローズします。

Edit Actions

Also available in: Atom PDF