LinuxサービスセットでサポートしているRAIDコントローラ関連のオプションデバイス/オンボードデバイスのドライバに関するQ&A集です。
RAIDコントローラ
■MegaRAID系 RAIDコントローラ全般
■N8103-189/190/191/192/193/194/195/196/201
■N8103-195
■N8103-237/238
システムログ(/var/log/messagesなど)に以下のメッセージが出力されることがありますが、動作上の問題はありません。
(RHEL9/RHEL8/RHEL7)
対象OS
- RHEL9.1 (5.14.0-162.6.1.el9_1) 以降
- RHEL8.2 (4.18.0-193.el8) 以降
- RHEL7.1 (3.10.0-229.el7) 以降
出力メッセージ
※ x には環境により異なる値が表示されます。
megaraid_sas xxxx:xx:xx.x: Firmware crash dump is not available
問題内容
/sys/class/scsi_host/hostX/ 配下の fw_crash_buffer ファイルを参照したときに出力されます。また、ESMPRO/ServerAgent の collect ログ(collectsa.sh)を採取したときにも出力されます。
ファームウェアダンプ機能が無効 (デフォルト:無効) になっている状態で上記ファイルを参照した場合に出力されるメッセージであり、動作上の問題はありません。
※ hostX は、RAIDコントローラに対応するSCSIホスト番号です。
RAIDコントローラ N8103-189/190/191/192/193/194/195/196/201 において、一時的なI/O高負荷などによりSCSIコマンドのタイムアウトが発生した場合に、以下のメッセージが出力され、ディスク (sdデバイス) がオフラインになることがあります。
(RHEL7)
対象ドライバ
- smartpqiドライバ Ver1.1.4-133 以前
出力メッセージ
本事象発生時に出力されるメッセージの抜粋です。メッセージ中の X は、環境によって異なります。
kernel: smartpqi XXXX:XX:XX.X: resetting scsi X:X:X:X
kernel: smartpqi XXXX:XX:XX.X: reset of scsi X:X:X:X: SUCCESS
kernel: sd X:X:X:X: [sdX] Medium access timeout failure. Offlining disk!
kernel: sd X:X:X:X: Device offlined - not ready after error recovery
対処方法
この問題は、smartpqiドライバ Ver1.2.4-065 で修正されています。最新のStarter Packを適用して、smartpqiドライバを Ver1.2.4-065 以降にアップデートしてください。
各Starter Packに収録されているドライバのバージョンについては、「Starter Pack / ドライババージョン対応表」を参照してください。
補足事項
smartpqiドライバ Ver1.2.4-065 以降にアップデート後も同じ事象が発生する場合は、ハードディスクなどが故障している可能性があります。ご契約のハードウェア保守員にハードウェアの点検を依頼してください。
N8103-195 RAIDコントローラに適用されているファームウェアのバージョンが5.00以降の場合、テープ装置へのI/Oがエラーになる事象が発生します。
(RHEL8/RHEL7)
対処方法
OSがRHEL8.5以降の場合
- 最新のStarter Pack (Version S8.10-010.05以降) を適用して、smartpqiドライバをVer2.1.18-045以降にアップデートしてください。
OSがRHEL8.4以前の場合
- smartpqiドライバを以下よりダウンロードし、アップデートを行ってください。
- ダウンロードにあたりましては、事前に「ドライバモジュールのご使用条件」および「ドライバソースコードのご使用条件」をお読みください。
- 該当するご使用条件にご同意いただけない場合にはダウンロードをしないでください。ダウンロードした場合には、ご使用条件にご同意いただいたものとします。
- ドライバモジュール適用前には、必要なデータのバックアップを行うことをお勧めします。
- アップデートの手順につきましては「適用手順」をご参照ください。
【RHEL7.3~7.9】
【RHEL8.1~8.4】
リストアするときの注意事項
テープからブートディスクにリストアするときは、RHEL8.7 以降のインストールメディアで起動して、リストアを行ってください。
RHEL8.6 以前のインストールメディアに含まれる smartpqi ドライバには本問題が内在しているため、RHEL8.6 以前のインストールメディアで起動した場合、テープ装置へのI/Oがエラーとなり、リストアが行えません。
RAIDコントローラ N8103-237/238 において、システム起動中に以下のメッセージが出力され、起動に失敗する事象が発生することがあります。
(RHEL8)
出力メッセージ
本事象発生時に出力されるメッセージの抜粋です。メッセージ中の X は、環境によって異なります。
smartpqi XXXX:XX:XX.X: doorbell register bit 0x1 not cleared
smartpqi XXXX:XX:XX.X: re-enabling SIS mode failed with error -110
smartpqi: probe of XXXX:XX:XX.X failed with error -110
(省略)
dracut-initqueue[XXXX]: Warning: dracut-initqueue timeout - starting timeout scripts
dracut-initqueue[XXXX]: Warning: dracut-initqueue timeout - starting timeout scripts
dracut-initqueue[XXXX]: Warning: Could not boot.
Starting Setup Virtual Console...
[ OK ] Started Setup Virtual Console.
Starting Dracut Emergency Shell...
Warning: /dev/disk/by-uuid/XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX does not exist
Generating "/run/initramfs/rdsosreport.txt"
Entering emergency mode. Exit the shell to continue.
Type "journalctl" to view system logs.
You might want to save "/run/initramfs/rdsosreport.txt" to a USB stick or /boot
after mounting them and attach it to a bug report.
dracut:/#
対処方法
本体装置の製品マニュアル等を参照し、RAIDコントローラ N8103-237/238 のファームウェアをアップデートしてください。