お客様にて一次解析を行って頂く場合、
ftsmaint lsLong コマンドを実行し、各デバイスの状態を確認して頂く方法があります。
ftsmaint lsLong コマンドは、各デバイスに付与された「デバイスパスID」に対し
その詳細情報を表示します。デバイスパスIDが表すデバイスについては、
運用ガイドまたはメンテナンスガイドの「デバイスパス一覧」の項を参照ください。
障害が発生した場合は、以下の手順を実施してください。
(1) ft管理アプライアンスにrootユーザアカウントでログインし、
以下のコマンドを実行してください。
# /opt/ft/bin/ftsmaint lsLong
(2) ftsmaintコマンドがエラーになった場合は、ft管理アプライアンス上の
二重化状態監視プロセスが正しく動作していない可能性があります。
下記「関連情報」に記載しているコンテンツを参照ください。
(3) ftsmaint lsLong コマンドにて、各デバイスに対する詳細情報が表示された場合は
"Op State" が "SIMPLEX" と表示されるデバイスを探します。
該当デバイスの相手側のデバイスに障害が発生している可能性があります。
代表的な障害のパターンとして、以下のパターンがあります。
◆ CPUモジュールに故障が発生している場合
(※)デバイスパスID "0" は、CPU/IOモジュール0側のCPUモジュールを表します。
相手側のデバイスは、CPU/IOモジュール1側のCPUモジュールであり
デバイスパスID は "1" です。
<SIMPLEXが表示されるデバイス>
H/W Path : 0
Description : Combined CPU/IO
State : ONLINE
Op State : SIMPLEX ・・・(*1)
Reason : PRIMARY
<相手側のデバイス>
H/W Path : 1
Description : Combined CPU/IO
State : BROKEN ・・・(*2)
Op State : SHOT ・・・(*3)
Reason : NONE
(*1) "0" の "Op State" が "SIMPLEX" と表示されます。
(*2) 相手側 "1" の "State" が "BROKEN" と表示されます。
(*3) 相手側 "1" の "Op State" が "SHOT" と表示されます。
◆ IOモジュールに故障が発生している場合
(※)デバイスパスID "10" は、CPU/IOモジュール0側のI/Oモジュールを表します。
相手側のデバイスは、CPU/IOモジュール1側のI/Oモジュールであり
デバイスパスID は "11" です。
<SIMPLEXが表示されるデバイス>
H/W Path : 10
Description : Combined CPU/IO
State : ONLINE
Op State : SIMPLEX ・・・(*1)
Reason : PRIMARY
<相手側のデバイス>
H/W Path : 11
Description : Combined CPU/IO
State : BROKEN ・・・(*2)
Op State : BROKEN ・・・(*2)
Reason : DIAGNOSTICS_FAILED
(*1) "10" の "Op State" が "SIMPLEX" と表示されます。
(*2) 相手側 "11" の "State" 及び "Op State" が "BROKEN" と表示されます。
◆ ディスク縮退が発生し再同期中の場合
(※)デバイスパスID "10/40/1" は CPU/IOモジュール0側のスロット0の
ディスクドライブを表します。
相手側のデバイスは、CPU/IOモジュール1側のスロット0の
ディスクドライブであり、デバイスパスID は "11/40/1" です。
ft制御ソフトウェアのバージョンにより、以下のように表示される場合が
ありますので、適宜読み替えてください。
vmhba100500 → vmhba0
vmhba110500 → vmhba1
<SIMPLEXが表示されるデバイス>
H/W Path : 10/40/1
Description : Disk Drive
State : ONLINE
Op State : SIMPLEX ・・・(*1)
Reason : NONE
<相手側のデバイス>
H/W Path : 11/40/1
Description : Disk Drive
State : ONLINE
Op State : SYNCING ・・・(*2)
Reason : NONE
(*1) "10/40/1" の "Op State" が "SIMPLEX" と表示されます。
(*2) 相手側 "11/40/1" の "Op State" が "SYNCING" と表示されます。
ディスク縮退が発生している場合は、同時に以下のコマンドを実行します。
■ESXi 6.7以前のバージョンの場合
# esxcli -s <ESXi ホストのIP アドレス> storage mpm list
■ESXi 7.0の場合
# esxcli -s <ESXi ホストのIP アドレス> ftsys mpm list
ディスクの同期が外れ再同期中の場合、一時的に切り離されたディスク
の状態が [ syncing ] と表示されます。
ディスクが二重化している場合は双方が [ in_sync ] と表示されます。
(コマンド実行例)
# esxcli -s xxx.xxx.xxx.xxx storage mpm list
Info
----------------------------------------------------------------
mpm0 : 143066368 blocks (139713 MB) [2/2]
| recover=0.6% (932224/143066368) finish=480.1min (4906K/s)
\_ vmhba100500:C0:T0:L0 (10/40/1) [ in_sync ]
\_ vmhba110500:C0:T0:L0 (11/40/1) [ syncing ]
◆ イーサネットケーブルが接続されていない場合
(※)デバイスパスID "10/6" は CPU/IOモジュール0側の
ネットワークコントローラを表します。
相手側のデバイスは、CPU/IOモジュール1側のネットワークコントローラであり
デバイスパスID は "11/6" です。
ft制御ソフトウェアのバージョンにより、以下のように表示される場合が
ありますので、適宜読み替えてください。
なお、末尾の数字0, 2は環境によって変化することがあります。
vmnic100600 → vmnic0
vmnic110600 → vmnic2
<SIMPLEXが表示されるデバイス>
H/W Path : 10/6
Description : Network Ctlr
State : ONLINE
Op State : SIMPLEX ・・・(*1)
:
:
H/W Path : vmnic100600
Description : Network Interface
State : ONLINE
Op State : SIMPLEX ・・・(*1)
Reason : NONE
<相手側のデバイス>
H/W Path : 11/6
Description : Network Ctlr
State : ONLINE ・・・(*2)
Op State : ONLINE ・・・(*2)
:
:
H/W Path : vmnic110600
Description : Network Interface
State : BROKEN ・・・(*3)
Op State : BROKEN ・・・(*3)
Reason : MEDIA_DISCONNECT ・・・(*4)
(*1) "10/6" の "Op State" が "SIMPLEX" と表示されます。
(*2) 相手側 "11/6" の "State" 及び "Op State" は "ONLINE" と表示されます。
(*3) "11/6" の ネットワークインターフェース である "vmnic110600" を確認します。
"State" 及び "Op State" が "BROKEN" と表示されます。
(*4) "vmnic110600" の "Reason" が "MEDIA_DISCONNECT" と表示されている場合は、
イーサネットケーブルが接続されていないと判断します。
なお、詳細な調査を行う場合は、buggrabberログを採取し
NEC カスタマーサポートセンターへお問い合わせください。
buggrabberログの採取方法については下記「関連情報」に記載している
コンテンツを参照ください。
※「関連情報」に記載しているコンテンツはご契約内容により閲覧できない場合があります。