ftサーバ(Windowsモデル)の R320g および R320h では以下の事象が間欠的に発生することを確認しております。
・OS起動中の画面で停止し、OSの起動が完了しない。(下記画像)
・上記事象が発生した状態でftサーバを強制再起動すると、プライマリの切り替わりが発生する。
その後はOSの起動に成功し、ディスクの再同期が開始される。
※このディスクの再同期自体は意図した動作ですので、発生した場合は完了するのをお待ちください。
CPU/IOモジュール#0側がプライマリだったものが#1側へ切り替わった状況であれば、
OS起動後には#1側のディスクを同期元にして再同期が行われます。
もし、現時点でも上記画面のままである場合は、OSの起動を完了させるためにftサーバの強制再起動が必要です。
本コンテンツの既知事象に該当する場合はメモリダンプが採取できない可能性が高いですが、後述の「回避策を適用後も事象が発生した場合について」と同様の操作を行い、ダンプスイッチにてftサーバを強制再起動してください。強制再起動後、プライマリモジュールの切り替わりの発生と、内蔵ディスクの再同期が開始されることに留意していただくようお願いします。
本事象が発生する環境
構成により発生頻度の違いはありますが、以下の環境で事象が発生する可能性がございます。
【機種】Express5800/R320g および R320h
【OS】すべてのサポートOS(Windows Server 2016 / 2019 / 2022)
【ft制御ソフトウェア】すべてのサポートバージョン(12.1.3275 以降)
事象の発生理由
OS起動時にLANドライバの読み込み処理で遅延(以下、「ドライバ問題」と記載)が発生し、ftサーバの二重化を制御するドライバ(srabidドライバ)がLANドライバの読み込みをリトライさせることでOSの起動処理が進まなくなっています。
この問題はPCIスロットに「1000BASE-T 4ch ボード」を搭載している場合に発生することを確認しています。
ただし、共通のLANドライバを使用する標準LAN(オンボード)側でも同様の問題が発生する可能性はあるため、予防保守の観点からも「本事象が発生する環境」に該当する場合は回避策の適用を推奨いたします。
回避策
本ページの下部から SraBidActionTool.zip をダウンロードし、本物件に同梱している readme.txt に記載の適用手順を確認し、回避策を適用してください。
回避策は運用状況に合わせ、以下の「①+②の両方」もしくは「①のみ」を適用してください。
①レジストリの変更
ftサーバの二重化を制御するドライバ(srabidドライバ)のレジストリの変更により、モジュールの組み込み時にドライバ問題が発生した際のリトライ処理を見直し、OS起動中の画面で停止する事象を回避します。
ドライバ問題が起きてない場合は、本レジストリの変更による影響はありません。
ドライバ問題が起きた場合は、問題が起きたLANポートが疎通不可の状態でOSが起動しますが、NICチーミングが組まれていれば通常通りチーム経由で疎通が可能です。
また、ドライバ問題は両CPU/IOモジュール同時には発生しないことを確認していますので、NICチーミングを組んでおくことが疎通不可に対する回避策になります。
ドライバ問題が起きると該当LANポートが疎通不可となり、PCIモジュールが縮退状態となりますが、OSを一旦再起動するか、ドライバ問題が発生側(DUPLEX側)のPCIモジュールの停止と起動を行うことでこれらは復旧します。
②自動復旧スクリプトの設定
自動復旧スクリプトの設定により、①によりドライバ問題の影響でPCIモジュールが縮退した状態でOSが起動した場合に、自動的に二重化復旧する仕組みを提供します。
本スクリプトはドライバ問題が起きた場合のみ、OS起動から約5分経過後に動作します。
本スクリプトは設定せず、ftサーバユーティリティの手動での操作により、ドライバ問題が発生したPCIモジュール側(DUPLEX側)の停止・起動で復旧させることも可能です。
自動復旧スクリプトが登録するイベントについて
自動復旧スクリプトでは [イベントビューアー]-[Windows ログ]-[システム] に動作時のイベントを登録します。
自動復旧スクリプトを適用された場合、OS起動してから約5分経過時点でイベントログ(システム)にソース名:SraBidAction の何らかのイベントが登録されますので、その場合は自動復旧スクリプトが適用できている状態です。
もし、該当のイベントが何も登録されない場合は、セキュリティ関連ソフトによってスクリプトの動作が抑制されている可能性がありますので、該当の設定の確認と見直しをお願いします。
登録されるイベントは以下のとおりです。
・ドライバ問題を未検出時(OS起動から約5分経過時点)
ソース名 :SraBidAction
レベル :情報
イベントID :100
メッセージ例:No driver issues were detected.
・ドライバ問題を検出時(OS起動から約5分経過時点)
ソース名 :SraBidAction
レベル :警告
イベントID :200
メッセージ例:Detected driver issues in PCI module XX.
・復旧処理が正常に完了時
ソース名 :SraBidAction
レベル :情報
イベントID :101
メッセージ例:Recovery process for PCI module XX has been completed.
・復旧処理時に何らかのエラーが発生時
ソース名 :SraBidAction
レベル :エラー
イベントID :300
メッセージ例:(各種エラー内容)
回避策を適用後も事象が発生した場合について
回避策①のレジストリ変更を行ったにもかかわらずOS起動中に画面で停止する事象が起きた場合は、別要因で事象が発生している可能性があります。
事象が起きている状態でftサーバ前面のダンプスイッチを4秒~8秒間押し、メモリダンプの採取を試みてください。
なお、ダンプスイッチを押してからftサーバの再起動が発生するまでに時間を要することがあるため、10分程度お待ちください。それでも再起動が発生しない場合は、電源ボタンを長押しして強制再起動してください。
再起動発生後、ftサーバではモジュールを組み替えてOSの起動を試みる動作がありますので、CPU/IOモジュールのプライマリの切り替わりが発生した場合は、そのままOSの起動が完了するのをお待ちください。
OSの起動が完了しましたら、Collectログの採取をお願いいたします。メモリダンプ(デフォルトの出力先は「C:\NECDump」)が出力されていればZIP形式で圧縮し、Collectログと合わせてPPサポート経由でお問い合わせください。