プロジェクト

全般

プロフィール

その他問い合わせ #3662

完了

エラー(ZBX_TCP_WRITE() failed)について

匿名ユーザー さんが1年以上前に追加. 12ヶ月前に更新.

ステータス:
終了
優先度:
通常
担当者:
-
開始日:
2023/05/17

説明

お世話になっております。

2つのジョブを時刻待機で同時に起動するという動きで、数ヶ月動かしていてはじめてエラーとなりました。
出力していた例外エラーは以下です。

3615982:20230517:060042.737 [ERROR] [JARUNICONJOB200012] Cannot send data:inner_jobid [344825], message [ZBX_TCP_READ() failed: [4] Interrupted system call]
3615980:20230517:060042.737 [ERROR] [JARUNICONJOB200012] Cannot send data:inner_jobid [344765], message [ZBX_TCP_READ() failed: [4] Interrupted system call]

agent側のログにもエラーが出力していました。

3680:20230517:060012.421 [ERROR] In ja_tcp_send_to() error: ZBX_TCP_WRITE() failed: [0x00002745] 確立された接続がホスト コンピューターのソウトウェアによって中止されました。
3676:20230517:060048.718 [ERROR] In ja_job_exec_close() agent close failed.Can not send the result to server. jobid: 344765
3676:20230517:060050.874 [ERROR] In ja_job_exec_close() agent close failed.Can not send the result to server. jobid: 344825

似たような事象のチケットを見つけましたが、発生原因は同じでしょうか?
https://www.jobarranger.info/redmine/issues/3550
私が使用している環境は、jobarranger5.1.0を利用しています。
チケットは2年以上前なのでバージョンが古いのかなと思いますが、5.1.0でもまだ改善されていないのでしょうか?

エラーが発生した時間帯のログを抜粋して添付いたします。


ファイル

jobarg_agentd_抜粋.log (18.7 KB) jobarg_agentd_抜粋.log 匿名ユーザー, 2023/05/17 17:02

保守サポート 担当2 さんが1年以上前に更新

示されたログを見る限りですが、Network関係の問題のように見受けられます。

下記、時刻に、SocketがCloseされたことをOSから通知されてますが…。

3680:20230517:060012.421 [ERROR] In ja_tcp_send_to() error: ZBX_TCP_WRITE() failed: [0x00002745] 確立された接続がホスト コンピューターのソウトウェアによって中止されました。

Server側では、Socketがクローズが通知されず、Timeoutしてエラーとなっています。
3615982:20230517:060042.737 [ERROR] [JARUNICONJOB200012] Cannot send data:inner_jobid [344825], message [ZBX_TCP_READ() failed: [4] Interrupted system call]

保守サポート 担当2 さんが1年以上前に更新

  • ステータス新規登録 から 回答中 に変更

保守サポート 担当2 さんが約1年前に更新

更新が無いのでCloseします。

保守サポート 担当2 さんが12ヶ月前に更新

  • ステータス回答中 から 終了 に変更

他の形式にエクスポート: Atom PDF