Express5800/R320g では以下の事象が発生することを確認しております。
BMC (Baseboard Management Controller) がアクセス不可となった場合、その BMC が属するPCIモジュールを切り離し/組み込みにより自動で復旧する動作を行います。
このとき、何らかの要因で WDT (Watch Dog Timer) のタイムアウト値である3分以内に切り離し処理が完了しなかった場合、WDTタイムアウトとなり、ftサーバの再起動が発生します。
本事象が発生する可能性のあるft制御ソフトウェアのバージョンは次のとおりです。
・12.1.3275
・12.1.3452
回避策
BMCの異常によりWDTタイムアウトが発生する事象の回避策として、WDTタイムアウトの発生までの設定値を初期設定の3分から15分へ長くしていただけますようお願いいたします。
なお、そのような事象が発生するケースでは、PCIモジュールの切り離しが完了するまでに長くても約4分要する見込みですので、本設定の変更はWDTタイムアウトまでの時間を長くすることで、その切り離し中にWDTタイムアウトとなることを回避するものです。
後述の[ダウンロード]より設定変更ツール(WdtLongTimeTool.BAT)をダウンロードいただき、WDTタイムアウト値を変更して運用をお願いします。
設定手順については提供する圧縮ファイルに含まれる readme.txt を参照してください。
また、事象が未発生の環境でも発生を予防するために、本ツールを適用して設定変更することを推奨します。
設定変更に関する補足
WDTタイムアウトの発生までの設定値を初期設定の3分から15分へ変更した場合、今回のようなケース以外(BMCに異常がない状況)でOSのストールが発生した場合も、WDTタイムアウトは15分で動作します。
そのため、WDTタイムアウトを伴うような障害時のftサーバの再起動発生までの時間が長くなりますが、それ以外の動作には特にデメリットはありません。