その他問い合わせ #3733
closed前のジョブが完了する前に次のジョブが実行される
Description
今回実行しているジョブネットは、複数のジョブを直列に接続しています。
ジョブネットの4番目のジョブ(ログと実行時刻からjobid: 9342と判断)が実行終了していないにもかかわらず、
ジョブネットの5番目のジョブ(ログと実行時刻からjobid: 9344と判断)が実行開始されています。
ジョブ実行コマンド側のログから、jobid: 9342が実行中にjobid: 9344を実行したため、jobid: 9342がエラーになっていることが判明しております。
Q1: 本現象の原因をご教示ください。
Q2: 本現象を今後発生させないための回避策をご教示ください。
【JobArrangerのバージョン】
Server: jobarg_server[Version 6.0.5.1 (revision 3175)] (RedHatEnterpriseLinux8.2で動作)
Agent: jobarg_agentd[6.0.5.1 (revision 3175)] (WindowsServer2019で動作)
【jobid: 9342 の変数値(一部)】
CURRENT_TIME 20240522111607
ICON_STATUS 2
JOBARG_MESSAGE Check job status(end) failed. jobid: 9342
JOBNET_BOOT_TIME 202405221112
JOB_EXIT_CD -1
MANAGEMENT_ID 715
SIGNAL 0
Files
Updated by 保守サポート 担当333 6 months ago
- Status changed from 新規登録 to 担当者処理中
- Assignee set to 保守サポート 担当333
Updated by 保守サポート 担当333 6 months ago
Agent logで12:20:43 頃にメインプロセスID 3100 に関連するログがありますでしょうか。
また、ログがある場合連携していただくことは可能でしょうか。
Updated by Anonymous 5 months ago
- File jobarg_agentd.zip jobarg_agentd.zip added
Agent logで12:20:43 頃にメインプロセスID 3100 に関連するログがありますでしょうか。
Agent logとは、下記ディレクトリのファイルで認識合っておりますでしょうか。
C:\Program Files\Job Arranger\Job Arranger Agent\logs\jobarg_agentd.log
先日添付させていただいたjobarg_agentd.logは、発生日のみ切り出したログですので、発生日にコピーしていたjobarg_agentd.logを添付いたします。
「3100」でjobarg_agentd.logを検索したところ、以下の行が見つかりました。
ジョブを実行していたWindowsServer2019は、2024/05/21 21:02 に停止し、2024/05/21 21:17 に起動しております。
3100:20240422:210024.183 [INFO] Job Arranger Agent shutdown requested
3100:20240422:210025.197 [INFO] Job Arranger Agent stopped. Job Arranger 6.0.5.1 (revision 3175).
3100:20240522:122043.125 [INFO] In ja_job_exec_end(), job id : 9342,total files read :2, process id : 2276 finished. 3100:20240522:122043.159 [WARN] job response message: the job is not running. inner_job_id: 9342, Server IP 10.110.4.15 3100:20240522:122043.160 [INFO] In ja_agent_send(), job id :9342 sent OK, job result sent to server IP 10.110.4.15, 3100:20240522:122043.160 [INFO] In ja_agent_close() jobid: 9342 closed OK, status: 2, server ip : 10.110.4.15 3100:20240522:122043.164 [INFO] In ja_jobfile_remove(),job id :9342's all data have been archived in close-folder.
3100:20240522:161917.477 [INFO] In ja_chk_job_begin(), job status check starts. jobid : 9729 3100:20240522:161917.477 [INFO] In ja_chk_job_begin(), job information exists.jobid :9729, folder_type :2 3100:20240522:161917.478 [INFO] In ja_chk_job_begin(), jobid :9729 is currently executing. Skip check. 3100:20240522:161917.478 [INFO] In ja_chk_job_begin(), job status check starts. jobid : 9747 3100:20240522:161917.479 [INFO] In ja_chk_job_begin(), job information exists.jobid :9747, folder_type :2 3100:20240522:161917.479 [INFO] In ja_chk_job_begin(), jobid :9747 is currently executing. Skip check. 3100:20240522:161917.480 [INFO] In ja_chk_job_begin(), job status check starts. jobid : 9791 3100:20240522:161917.480 [INFO] In ja_chk_job_begin(), job information exists.jobid :9791, folder_type :2 3100:20240522:161917.481 [INFO] In ja_chk_job_begin(), jobid :9791 is currently executing. Skip check.
Updated by 保守サポート 担当314 5 months ago
Server側のログを確認していまして、JobArranger Server - JobArranger Agentの構成では、入ってこないはずの通知がAgentから入ってきているように見えています。
JobArranger Serverが、存在していないでしょうか?
Updated by Anonymous 5 months ago
- File 開発環境サーバ構成_20240607.png 開発環境サーバ構成_20240607.png added
- JobArrangerServerがインストールされているサーバM
- JobArrangerAgentがインストールされているサーバA,サーバB,サーバC,サーバF
- 開発体制の都合上、開発環境は複数存在する
- サーバFは都合上、開発環境用に1台のみである
今回発生した事象は、サーバAにてジョブ実行を行ったときに発生しております。
サーバFに対してのジョブ実行が重複しなければ他のJobArrangerServerのジョブ実行に影響しない想定なのですが、認識誤りでしょうか。
また、認識誤りであれば、サーバFを共通サーバとして動作させる方法をご教示いただけますでしょうか。
Updated by 保守サポート 担当314 5 months ago
- Status changed from 担当者処理中 to 回答中
JobArranger 6.0.4からDocker、クラスタ等で、ServerのIPが変更された際、自動的に調整する機能が追加されてます。
今回のケースは、このIP自動調整機能により、別のServerのIPが、移動先のIPとして認識されたものと思われます。
下記のページにServerIDパラメータがありますので、JobArranger ServerのConfiguraitonファイルを修正して再起動してください。
JobArranger Serverごとに、異なるServerIDを設定してください。
https://www.jobarranger.info/jpn/jaz/6.manual/index.html?tgt=/4.0/1.Install/1.JobArrangerServer/04.Configuration.php