概要
iStorage StoragePathSavior(以降SPSと記載)では、リトライで復旧する可能性のあるI/Oエラーがパスから応答された場合には、I/Oのリトライを試みます。
リトライでI/Oが正常に処理された場合は、I/Oエラーを応答したパスを障害として扱わず、運用パスとしてそのまま継続利用します。
また、HWの故障状況によっては、パスフェイルオーバとパスフェイルバックを繰り返すような状態になる場合もあります。
上記の状況が継続して発生した場合、パスフェイルオーバに至らないままI/Oのリトライを繰り返して障害パスを使用し続けたり、パスフェイルオーバしてもすぐに元のパスに復旧するようなパス切替を繰り返すことで、iStorageディスクアレイ装置へのI/O性能が低下しシステム運用に支障をきたす場合があります。
SPSの間欠障害監視機能(※1)は、このような状態のパスを早期に閉塞することでI/O性能の劣化を最小限にとどめることができます。
なお、間欠障害監視機能の既定値はSPSのバージョンにより異なります。既定値が無効になっている場合には、本機能を有効化することを推奨します。
|
SPSのバージョン |
間欠障害監視機能の既定値 |
SPS for Windows |
8.4以下 |
無効(有効化することを推奨) |
9.0以上 |
有効 |
SPS for Linux |
8.1以下 |
無効(有効化することを推奨) |
9.0以上 |
有効 |
SPS for VMware |
4.0以下 |
無効(有効化することを推奨) |
5.0以上 |
有効 |
※1:間欠障害監視機能の詳細については以下のマニュアルを参照してください。
- StoragePathSavior利用の手引き(Windows編) : 3.5.5 間欠障害監視
- StoragePathSavior利用の手引き(Linux編) : 3.8 間欠障害監視機能
- StoragePathSavior利用の手引き(VMware編) : 3.3.3 間欠障害監視
SPSのバージョン確認方法
SPSのバージョンは次の方法で確認できます。
- サーバのOSがWindowsの場合
- コマンドプロンプトを「管理者として実行」で開きます。
- 次のコマンドを実行します。
> spsadmin /version
Version : X.X.X.X
Versionに表示された値が8.x.x.x以下の場合は、後述の有効化する手順を確認して間欠障害監視機能を有効にしてください。
9.x.x.x以上の場合は、既定値で有効化されていますので、有効化する手順は不要です。
- サーバOSがLinuxの場合
- root権限のユーザでログインします。
- 次のコマンドを実行します。
# cat /proc/scsi/sps/version
X.X.X
SPS for Linuxのバージョン9.0以降は、機能バージョン8.x.x以上が該当します。
表示された値が7.x.x以下の場合は、後述の有効化する手順を確認して間欠障害監視機能を有効にしてください。
8.x.x以上の場合は、既定値で有効化されていますので、有効化する手順は不要です。
- サーバOSがVMwareの場合
間欠障害監視機能を有効化する手順
間欠障害監視機能を有効化する手順は以下のとおりです。
- サーバのOSがWindowsの場合
- コマンドプロンプトを「管理者として実行」で開きます。
- 次のコマンドを実行します。
> spsadmin /monitormode enable
間欠障害監視の設定を変更しました。
MonitorMode (static state) : Enable
Interval : 10 min
Error count : 3
MonitorMode (recover state) : Enable
Interval : 5 min
Error count : 3
- サーバOSがLinuxの場合
- root権限のユーザでログインします。
- viなどのテキストエディタを利用して設定ファイル(/etc/sps.conf)を開き、間欠障害監視エントリ(MonitorMode)を"Enable"に書き換えます。
[修正前(例)]
Format:1.6
Watch: CHK:600s FLT:180s SACT:300s
FaultByWatch:Enable
MonitorMode:Disable
(以降、省略)
↓
[修正後(例)]
Format:1.6
Watch: CHK:600s FLT:180s SACT:300s
FaultByWatch:Enable
MonitorMode:Enable
(以降、省略)
- mkddコマンドを実行します。
# mkdd
parsing... Format:1.6 (OK)
parsing... Watch: CHK:600s FLT:180s SACT:300s (OK)
parsing... MonitorMode:Enable
(以降、省略)
- サーバOSがVMwareの場合
- SPSコマンドを利用する場合
- 管理サーバのvCLIコマンドプロンプトを開きます。
- 次のコマンドを実行します。
# spsadmin.pl [接続先オプション] --monitormode -e
This command takes 4 steps.
[Step 1] Checking the environment: 100%
[Step 2] Collecting the Storage information: 100%
[Step 3] Changing the state: 100%
[Step 4] Checking the result: 100%
The intermittent failure detection function is enabled.
- esxcliコマンドを利用する場合
- ダイレクトコンソールまたはSSHを使用して、ESXiホストにログインします。
- 次のコマンドを実行します(※2)。
# esxcli storage nmp satp generic deviceconfig set --config="ierr_mon=on" --device="デバイス名"
※2:間欠障害監視機能を有効化するすべてのデバイスに対して実行する必要があります。
- SPS 2.4 for VMware以降、かつESXi 6.5 P03(ビルド番号10884925)以降を使用している場合、引き続き、以下の手順を実施します。
- ダイレクトコンソールまたはSSHを使用して、ESXiホストにログインします。
- 以下の3つのコマンドを実行します。
# esxcli storage nmp satp rule remove --satp NEC_SATP_SPS --vendor NEC --model "DISK ARRAY" --description "iStorage" --boot
# esxcli storage nmp satp rule add --satp NEC_SATP_SPS --vendor NEC --model "DISK ARRAY" --description "iStorage" --option "ierr_mon=on" --boot
# esxcli system module parameters set -m nec_satp_sps -p default_ierr_mon_on=1
- SPSのdefault_ierr_mon_onのモジュールオプションが1となっていることを確認します。
# esxcli system module parameters list -m nec_satp_sps
本設定によって、新規追加したデバイスの間欠障害監視機能も自動で有効とします。
SPS 2.4 for VMware未満またはESXi 6.5 P03(ビルド番号10884925)未満を使用している場合に新規デバイスを追加した場合は、前段のデバイスごとの間欠障害監視機能の有効化を実行する必要がありますので、ご注意ください。
間欠障害監視機能によるパス閉塞時の対処
- パス閉塞時のメッセージ
間欠障害監視機能によるパス閉塞時は、以下のメッセージが登録されます。
OS |
出力されるファイル |
内容 |
Windows |
システムイベントログ |
ソース名:spsdsm、ID:283の警告ログ |
Linux |
システムログ |
sps: Warning: Intermittent errors ocurred. stopped Failback of path:"パス番号". |
VMware |
VMkernelログ |
NEC_SATP_SPS: [C0000005] Path "パス名" cannot be failbacked automatically. |
- パス閉塞時の対処
上記のメッセージが登録されている場合、HWの間欠障害が発生している可能性があります。
保守員に連絡し、HW観点での調査、および必要であれば障害部品の交換を依頼してください。
なお、間欠障害監視機能で閉塞したパスは自動で復旧しませんので、HW保守後に手動でのパス復旧が必要です。以下の「障害復旧後のパス復旧方法」を参照の上対処してください。
※ |
HW観点の調査の結果、本メッセージ登録がHW間欠障害によるものでは無かった場合、PP・サポートサービスの契約があれば、本メッセージが登録されている原因についてお問い合わせ頂くことが可能です。
その場合、関連情報にある「障害発生時の採取情報」を参照して必要ログを添付の上、PP・サポートサービスまでお問い合わせください。 |
障害復旧後のパス復旧方法
間欠障害監視機能によりパスが閉塞された場合は、自動でパス状態は復旧されません。以下のコマンドを実行して、手動でパス状態を復旧させてください。コマンドの詳細については、SPSのマニュアルを参照願います。
- サーバのOSがWindowsの場合
- コマンドプロンプトを「管理者として実行」で開きます。
- 次のコマンドを実行します。
> spsadmin /failback "ターゲット"
- サーバOSがLinuxの場合
- root権限のユーザでログインします。
- 次のコマンドを実行します。
# spsadmin --failback "ターゲット"
- サーバOSがVMwareの場合
- SPSコマンドを利用する場合
- 管理サーバのvCLIコマンドプロンプトを開きます。
- 次のコマンドを実行します。
# spsadmin.pl [接続先オプション] --failback "ターゲット"
- esxcliコマンドを利用する場合
- ダイレクトコンソールまたはSSHを使用して、ESXiホストにログインします。
- 次のコマンドを実行します(※3)。
# esxcli storage nmp satp generic pathconfig set -c "failback" -p "パスのランタイム名"
※3:間欠障害監視機能により閉塞されたすべてのパスに対して実行する必要があります。
【対象機種】
- Express5800/ラックサーバ
- Express5800/タワーサーバ
- Express5800/ブレードサーバ
- Express5800/スケーラブルHAサーバ
- Express5800/ftサーバ (Windowsのみ)
- NX7700xシリーズ (Windowsのみ)
- iStorage NSシリーズ (Windowsのみ)
【対象ストレージ】
- iStorage M/D/Aシリーズ
※SPS for VMwareは、iStorage Dシリーズに対応していません。
【対象OS】
Windows Server 2012, 2012R2, 2016, 2019, 2022
Red Hat Enterprise Linux 6, 7, 8
VMware ESXi 6.5, 6.7, 7.0