RAID

Disque durLe RAID

A l’origine le RAID était une technologie pour agglomérer plusieurs disques et qu’ils ne soient vu comme une seule entité.
Plusieurs système furent mis au point, la possibilité d’ajouter les capacités des disques ou une tolérance plus importante au panne ou les deux à la fois.

Il existe deux (voir trois) possibilités pour mettre en place le RAID.

  • Par hardware, le raid est géré par du matériel dédié.
  • Par software, le raid est géré par un logiciel particulier.
  • Par pseudo-hardware, le raid est géré par le contrôleur disque.

Nous ne parlerons pas de ce dernier car il s’agit en fait d’arguments commerciaux mais en aucun cas d’une technologie, elle n’est absolument pas fiable, et elle est à proscrire.
Les deux solutions ont leurs avantages et leurs inconvénients.

Nous verrons surtout l’utilisation et la mise en œuvre du RAID 5, car c’est le plus utilisé en environnement de production.

Le RAID matériel

Le RAID matériel est composé d’une carte, interne ou externe qui gère les disques.
L’avantage c’est que le système ne connaît pas les disques qui composes le système RAID.
La carte comprend de la mémoire, un processeur, et peut être d’une batterie de secours.

Le gros avantage du raid matériel est la charge serveur : Comme la gestion du RAID est pris en charge par la carte, la charge processeur est allégée.
Toutes les opérations de maintenance sont pris en charge par la carte en arrière plan.

Les inconvénients du RAID matériel : Les contrôleurs RAID utilisent chacun leur propre système pour gérer le système de fichier, donc les disques RAID ne seront pas compatibles les uns avec les autres.

Il faut donc prévoir d’avoir deux cartes contrôleurs en cas de panne de la première afin de pouvoir récupérer les données sur le RAID.

Il faut absolument choisir des contrôleurs haut de gamme car les contrôleurs bas de gammes n’apportent pratiquement aucun avantages par apport au RAID logiciel.

Un autre inconvénient du RAID matériel, souvent les contrôleurs se limitent à une seule technologies de support, il n’est pas possible d’avoir des disques SCSI, SATA, PATA … et de faire un RAID avec.

Conclusion : Le RAID matériel est intéressant si vous devez travailler avec des serveurs très chargés et ou les IO sont très importants.

Le RAID logiciel

Le RAID logiciel est une couche supplémentaire qui se place entre la couche matériel et le système de fichiers.

Les gros avantages de cette solution sont son coût, il est très souple et les systèmes RAID sont compatibles entre eux du moment qu’il sont sur le même système d’exploitation.

L’inconvénient majeur du RAID logiciel est dans cette couche que l’on intercale entre le matériel et le système de fichier, cette couche peut avoir quelques soucis et certaines fonctionnalités peuvent manquer. (notamment les fonctions de contrôles)

Un autre problème est l’utilisation des ressources système, pas tellement sur le processeur mais surtout sur le bus qui va monopoliser d’importantes ressources.

Enfin l’installation du disque système n’est pas toujours possible en RAID. (problème avec les Boot-loader)

C’est cette application que nous voir.

Note importante : Les RAID sous windows et sous Linux sont incompatibles.
Pour information, windows 2003 server, prend en charge le RAID 0, 1 et 5
Linux prend en charge les RAID 0, 1, 4, 5, 6 et toutes les combinaisons.

Les niveaux RAID

Le RAID 0 :

L’idée du RAID 0 est de diminuer les temps d’accès aux disques, pour cela on utilise deux disques minimum et les lectures/écritures sont réparties sur les deux disques.

 
Le très gros inconvénient du RAID0 est la sécurité, si un des disques tombe en panne, les données sont définitivement perdus. Pour éviter cela on utilise le Raid 10 raid 1 au dessus d’un raid 0

Le RAID 1 :

Le RAID 1 ou mirroring, chaque disque contient les données de l’autre.

La capacité disque disponible est égale au plus petit espace disponible sur les disques. Il vaut mieux choisir des disques de même taille afin de ne pas perdre d’espace.

Le RAID 1 permet une certaine tolérance à la panne. Car si un des disques tombe en panne le contrôleur désactive le disque malade et active le deuxième disque qui prend la relève.

Lorsque le disque défectueux est changé, le contrôleur reconstruit le RAID 1, automatiquement ou manuellement.


L’inconvénient du RAID 1 est la perte de place car il faut deux disques mais l’espace disponible n’est la capacité que d’un.

Le RAID 5 :

Le RAID 5 essaye de combiner les avantages du RAID 0 et du RAID 1.

Le nombre de disque minimum est de 3. Les données et une bande de parité sont inscrites de façon rotative sur les disques.
Bande de parité : Il s’agit d’une opérations logique (XOR) entre les données. Cette bande permet de reconstituer les données en cas de perte.

Les disques doivent avoir la même taille, même si aujourd’hui certains contrôleurs autorise des disques de taille différentes.
Le RAID 5 autorise la perte d’un des disques, car pour les données perdus, il est possible de reconstituer les données.

La taille du raid se calcule grâce à la formule : (n – 1).D où n est le nombre de disques constituant le RAID et c la capacité d’un disque. Dans le cas de disque de capacité différente, il faudra prendre la plus petite capacité. Calcul des disques avec RAID

Les autres RAID :

  • Le RAID 2 :
    Il permet de combiner les volumes, et d’écrire les données de contrôle sur un disque à part. Ce type de RAID est obsolète et n’est plus utilisé.
  • Les RAID 3 et 4 :
    Ils sont presque équivalents, l’un travaille avec les octets, l’autre avec les blocs.

La différence avec le RAID 5 est que la bande de parité est inscrite sur un unique disque, il faut donc veiller à avoir un disque de très bonne qualité car les écritures y sont fréquentes.

  • Le RAID 6 :
    Le RAID 6 est une évolution du RAID 5, il double les données de contrôle. L’inconvénient principale est son coût car il faut au moins 5 disques, de plus la charge processeur est plus importante car il faut calculer deux contrôles.

De plus la reconstruction du RAID 6 est très longue, par contre il supporte la panne de deux disques.

Les disques de rechange (SPARE) :

L’idée est d’avoir un disque de rechange disponible en cas de crash. Ce disque n’est pas utilisé en temps normale.
Si un des disques vient à avoir un problème, ce dernier est placé dans un état défaillant et le RAID commence sa reconstruction en prenant le disque de SPARE. Quand la reconstruction est finie, il est possible de changer le disque défaillant qui devient le nouveau disque de SPARE.
Les disques de SPARE s’utilisent surtout avec le RAID 5.

 

Mise en garde :

Lors de la mise en place de techniques de sécurisation des postes ou des serveurs, les administrateurs ont tendance à faire une confiance bien trop grande au système.

Hors mettre en place un serveur en RAID 5 limite les risques mais ne les supprime pas.
Il faut impérativement faire des sauvegardes et LES VÉRIFIER régulièrement.

Lors de l’achat d’un nouveau serveur, souvent les disques installés sont de la même série, hors cela pose quelques problèmes.

Si un des disques à une défaillance, il y a de forte chance pour qu’un problème identique intervienne sur les autres. Hors en RAID 5 la tolérance à la panne est de un disque….
Et si le disque de SPARE est lui aussi de la même série, il n’y changera rien … ( c’est du vécu et je vous assure que se n’est pas amusant de perdre toute une grappe de disques …)

L’utilitaire mdadm sous Linux est très puissant, il permet de presque tout faire avec le RAID y compris, par exemple créer un RAID 5 avec 2 disques, (ce qui ne doit pas se faire). Il faut donc bien faire attention à ce que l’on fait.

Il est tout à fait possible de d’utiliser un disque Raid pour le répertoire / ou /boot mais cela pose un problème. Le Boot Loader que vous utilisez doit connaître Raid car sinon le système ne pourra pas lire le disque puisqu’il ne connaîtra pas le système de fichier.
La nouvelle version de Grub (2) utilise un système de module qu’il est possible de lancer au lancement de ce dernier. Donc dans grub2 il faut demander le chargement du module Raid pour que grub puisse monter la partition.

Cette remarque est valable également pour le LVM.