操作問い合わせ #1797
完了ジョブ終了遅延が、Zabbixに連携できない場合があります。
説明
担当者どの
お世話になります。
JOBARGで実行したジョブの終了遅延をZabbixにて検知できるように設定しているのですが、検知できない場合があります。
原因と対策について、ご教示ください。
<事象>
JOBARGsvrと別のサーバで稼動しているJOBARGagtにて実行したジョブの終了遅延がZabbixで検知できません。
JOBARGsvrと同居しているJOBARGagtにて実行したジョブの終了遅延はZabbixで検知できます。
ただし、何れの場合も、ログファイル(/var/log/jobarranger/jobarg_server.log)には、終了遅延のメッセージ(JAJOBICONJOB300001)が書かれています。また、ジョブの異常終了は問題なく検知できます。
<設定>
ログメッセージ定義ファイル(/etc/jobarranger/locale/logmessage_64BIT.txt)にて、終了遅延メッセージ(JAJOBICONJOB300001)をZabbixへ連携するようにフラグを立てています。
JAJOBICONJOB300001,3,1,In %s() timeout occurrence. inner_job_id: %lu, timeout: %s, start_time: %s, jobnet_id: %s, job_id: %s, user_name: %s
<環境>
JOBARGsvr:1.4.1 JOBARGagt:2.1.0
※JOBARGsvr:2.1.0 JOBARGagt:2.1.0 でも同事象が発生したため、バージョン混在の問題ではなさそう。
現在、JOBARGのバージョンアップを実施中であり、Serverも近々バージョンアップする予定です。
<想定回避策>
解決に時間を要す場合は、次の対応により暫定回避を検討しています。
ログファイル(/var/log/jobarranger/jobarg_server.log)監視を追加し、"ERROR"、"WARN"の文言を検知する。
よろしくお願いします。
ファイル