J'utilise le trio [SAS HBA + multipathd + zfs]. La configuration de multipath m'impose de figer le GUID des disques dans un fichier de conf, il faut donc mettre à jour multipath.conf à chaque changement de disque.
Repérer un disque en panne :
- MD1200/1400
zpool status <pool> donne l'alias multipath du disque (B2D0, par exemple). Le fichier /etc/multipath.conf assure la correspondance GUID <-> alias (et indique donc la position du disque dans la baie, dans mes réglages).
- MD3060e :
Les tiroirs sont numérotés de 3 à 7 (encl) en partant du haut. Le slot [0-11] correspond à celui du disque physique dans le tiroir.
1 2 3 4 5 6 7 | zpool status -x | less # alias B1D21
ls -l /dev/disk/by-id/ | grep B1D21
-> lrwxrwxrwx 1 root root 11 août 29 14:50 scsi-B1D21 -> ../../dm-47
ls -l /dev/disk/by-id/ | grep dm-47
-> lrwxrwxrwx 1 root root 11 août 29 14:50 scsi-35000c5006349c69f -> ../../dm-47
-> lrwxrwxrwx 1 root root 11 août 29 14:50 wwn-0x5000c5006349c69f -> ../../dm-47
sas2ircu 0 display | less (grep 5006349c69 ) -> encl:slot
|
relever un Health Check : smartctl -a -d scsi /dev/mapper/B1D21
Remplacer un disque en panne :
Méthodologie :
- Matériel :
- tournevis, changer le disque défectueux (ici B1D21).
- Vérifier que lors de l'insertion du nouveau disque, tous les disques clignotent au moins une salve (indique la prise en compte du nouveau disque par le controleur SAS et multipathd)
- SAS HBA
- sas2ircu 0 DISPLAY | less ou sas2ircu 1 DISPLAY | less
- Repérer, à l'emplacement prévu le GUID du nouveau disque (50000c0f01b9de50)
- multipathd
- Remplacer l'ancien GUID par le nouveau dans /etc/multipath.conf (ne pas oublier le 3 devant !)
- multipath -F && multipath -r && multipath (flush & reload, au besoin insister séparément)
- multipath -ll -v 2 | less pour vérifier que le(s) nouveau(x) disque(s) sont bien là
- update-initramfs -u -k all pour le prochain reboot
- systemctl restart smartd.service pour refresh du smartd
- ZFS
- zpool replace baie2 B1D21 (à faire une fois pour chaque disque, si plusieurs disques).
Note
Sur les megasasctl (Dell R510/R720/R730) : Controleur H310
- gaffe à la foreign config qu'il faut effacer dans le bios H310
- reboot obligatoire pour la prise en compte du changement de disque (bios H310)