Devis 0 Devis

Définition d'un système RAID

Très présent en Informatique Industrielle, le terme RAID est l'acronyme de "Redundant Array of Independent Disks", qui signifie littéralement "Regroupement Redondant de Disques Indépendants". D'après son nom, nous avons déjà une bonne idée de ce que cette technologie est censée faire. Il ne s'agit de rien d'autre que de créer un système de stockage de données utilisant plusieurs unités de stockage entre lesquelles les données sont distribuées ou répliquées.

La technologie RAID est divisée en configurations appelées "tiers", grâce auxquelles nous pouvons obtenir différents résultats en termes de possibilités de stockage d'informations. Pour des raisons pratiques, nous allons considérer un RAID comme un seul magasin de données, comme s'il s'agissait d'une seule unité logique, bien qu'il contienne plusieurs disques durs physiquement indépendants. Ces unités de stockage peuvent être soit des disques durs mécaniques (HDD), soit des disques durs solides (SSD).

L'objectif ultime du RAID est de fournir à l'utilisateur une plus grande capacité de stockage, une redondance des données pour éviter les pertes de données et des vitesses de lecture et d'écriture des données plus rapides que si nous n'avions qu'un seul disque dur. Bien entendu, ces fonctionnalités seront améliorées indépendamment en fonction du niveau de RAID que l'on souhaite mettre en œuvre.

Exemples de PC industriels dotés d'un systèmes RAID

Comment fonctionne un système RAID ?

Un système RAID fonctionne en plaçant les données sur plusieurs disques durs, et en permettant aux opérations d'entrée et de sortie (E/S) de fonctionner de manière équilibrée, ce qui améliore les performances. En d'autres termes, soit les données sont écrites sur les deux disques en même temps, soit les données sont écrites sur un disque et les données sont écrites sur un autre disque pour répartir la charge de travail. Les systèmes RAID sont présentés au système d'exploitation comme s'il s'agissait d'un seul disque logique, puisqu'ils sont constitués d'un seul volume.

Pour qu'un système RAID fonctionne, un contrôleur RAID doit être présent, qu'il soit matériel ou logiciel. Aujourd'hui, la grande majorité des PC utilisateurs disposent déjà d'un contrôleur RAID logiciel intégré au BIOS de la carte mère. En fait, les contrôleurs matériels ne sont plus utilisés que dans les environnements d'entreprise.

Quels types de RAID existe-t-il ?

Il existe de nombreux types de système RAID, bien que la plupart d'entre eux soient déjà en désuétude en raison de leur peu ou pas d'utilité par rapport aux autres, nous allons donc définir les plus courants.

Système RAID 0

RAID 0

Le premier RAID que nous avons est ce que l'on appelle le RAID niveau 0 ou "striping". Dans ce cas, il n'y a pas de redondance des données, car la fonction de ce niveau est de répartir les données stockées entre les différents disques durs connectés à l'équipement.

L'objectif de la mise en œuvre d'un RAID 0 est de fournir de bonnes vitesses d'accès aux données qui sont stockées sur les disques durs, puisque l'information est répartie de manière égale sur ceux-ci pour avoir un accès simultané à plus de données avec leurs disques fonctionnant en parallèle.

Le RAID 0 n'a pas d'information de parité ni de redondance des données, donc si l'une des unités de stockage se casse, nous perdrons toutes les données qui étaient à l'intérieur, à moins que nous n'ayons fait des copies de sauvegarde externes à cette configuration.

Pour réaliser un RAID 0, il faut faire attention à la taille des disques durs qui le composent. Dans ce cas, c'est le plus petit disque dur qui déterminera l'espace ajouté au RAID. Si nous avons un disque dur de 1 To et un disque dur de 500 Go dans la configuration, la taille de l'ensemble fonctionnel sera de 1 To, en prenant le disque dur de 500 Go et un autre 500 Go du disque de 1 To. C'est pourquoi il est idéal d'utiliser des disques durs de la même taille pour pouvoir utiliser tout l'espace disponible dans la matrice conçue.

Système RAID 1

RAID 1

Cette configuration, également appelée "mirroring", "shadowing" ou "duplexing", est l'une des plus couramment utilisées pour assurer la redondance des données et une bonne tolérance aux pannes. Dans ce cas, il s'agit de créer un magasin de données en miroir sur deux disques durs, ou deux ensembles de disques durs. Lorsque nous stockons une donnée, elle est immédiatement répliquée sur son disque miroir, de sorte que nous avons les mêmes données stockées deux fois.

Aux yeux du système d'exploitation, nous n'avons qu'une seule unité de stockage, à laquelle nous accédons pour lire les données qu'elle contient. Mais en cas de défaillance de celui-ci, il recherchera automatiquement les données sur le disque miroir. Il est également intéressant d'augmenter la vitesse de lecture des données, car nous pouvons lire les informations simultanément sur les deux disques miroirs.

RAID 2

Ce niveau RAID est rarement utilisé, car il est essentiellement basé sur un stockage distribué sur plusieurs disques au niveau des bits. À son tour, un code d'erreur est créé à partir de cette distribution de données et stocké sur des lecteurs exclusivement destinés à cet effet. De cette façon, tous les disques du stockage peuvent être surveillés et synchronisés pour la lecture et l'écriture de données. Comme les disques d'aujourd'hui sont déjà équipés d'un système de détection des erreurs, cette configuration est contre-productive et le système de parité est utilisé.

RAID 2

Ce niveau RAID est rarement utilisé, car il est essentiellement basé sur un stockage distribué sur plusieurs disques au niveau des bits. À son tour, un code d'erreur est créé à partir de cette distribution de données et stocké sur des lecteurs exclusivement destinés à cet effet. De cette façon, tous les disques du stockage peuvent être surveillés et synchronisés pour la lecture et l'écriture de données. Comme les disques d'aujourd'hui sont déjà équipés d'un système de détection des erreurs, cette configuration est contre-productive et le système de parité est utilisé.

RAID 3

Cette configuration n'est pas non plus utilisée actuellement. Elle consiste à répartir les données au niveau de l'octet dans les différentes unités qui forment le RAID, à l'exception d'une seule, où sont stockées les informations de parité afin de pouvoir joindre ces données lors de leur lecture. De cette façon, chaque octet stocké dispose d'un bit de parité supplémentaire pour identifier les erreurs et pouvoir récupérer les données en cas de perte d'un disque. L'avantage de cette configuration est que les données sont réparties sur plusieurs disques et que l'accès à l'information est très rapide, autant de disques en parallèle qu'il y a de disques. Pour configurer ce type de RAID, vous avez besoin d'au moins 3 disques durs.

RAID 4

Il s'agit également de stocker les données réparties en blocs entre les disques de stockage, en laissant l'un d'entre eux pour stocker les bits de parité. La différence fondamentale avec le RAID 3 est que si un disque est perdu, les données peuvent être reconstruites en temps réel grâce aux bits de parité calculés. Il vise à stocker de gros fichiers sans avoir besoin de redondance, mais l'enregistrement des données est plus lent précisément parce qu'il faut effectuer ce calcul de parité à chaque fois que quelque chose est enregistré.

Systèmes RAID 5

RAID 5

Également appelé système distribué avec parité. Ce niveau est aujourd'hui plus fréquemment utilisé que les niveaux 2, 3 et 4, notamment dans les dispositifs NAS. Dans ce cas, les informations sont stockées dans des blocs qui sont répartis entre les disques durs qui composent le RAID.

En outre, un bloc de parité est généré afin d'assurer la redondance et de pouvoir reconstruire les informations au cas où un disque dur serait corrompu. Ce bloc de parité sera stocké dans un lecteur différent de celui des blocs de données impliqués dans le bloc calculé, de sorte que les informations de parité seront stockées dans un lecteur différent de celui des blocs de données impliqués. 

Dans ce cas, nous aurons également besoin d'au moins trois unités de stockage pour assurer la redondance des données avec parité, et une seule défaillance d'unité sera tolérée à la fois. Si deux se cassent simultanément, nous perdrons les informations de parité, et au moins un des blocs de données concernés. Il existe une variante RAID 5E dans laquelle un disque dur de rechange est introduit pour minimiser le temps de reconstruction des données en cas de défaillance de l'un des disques primaires.

RAID 6

RAID 6 est essentiellement une extension de RAID 5, où un autre bloc de parité est ajouté pour obtenir un total de deux. Les blocs de données seront à nouveau répartis sur des lecteurs distincts et les blocs de parité seront également stockés sur deux lecteurs distincts. De cette façon, le système sera tolérant aux pannes pour un maximum de deux unités de stockage, mais par conséquent, nous aurons besoin de quatre unités pour former un RAID 6E. Dans ce cas, il existe également une variante RAID 6E ayant le même objectif que le RAID 5E.

Les niveaux de RAID imbriqués

Nous laissons derrière nous les 6 niveaux RAID de base et passons aux niveaux RAID imbriqués. Comme vous pouvez le deviner, ces niveaux sont essentiellement des systèmes qui ont un niveau RAID principal, mais contiennent d'autres sous-tiers qui fonctionnent dans une configuration différente.

Ainsi, il existe différentes couches RAID capables de remplir simultanément les fonctions des niveaux de base, et donc de combiner, par exemple, la capacité d'accès en lecture plus rapide d'un RAID 0 avec la redondance d'un RAID 1.
 

RAID 0+1 ou RAID 01

On peut également le trouver sous le nom de RAID 01 ou de mise en miroir de partitions. Il se compose essentiellement d'un niveau RAID 1 principal qui réplique les données trouvées dans un premier sous-niveau vers un second. À son tour, il y aura un sous-niveau RAID 0 qui remplira ses propres fonctions, c'est-à-dire qu'il stockera les données de manière distribuée entre les unités qui le composent.

Ainsi, nous avons un niveau principal qui assure la fonction de miroir et des sous-tiers qui assurent la fonction de division des données. De cette façon, lorsqu'un disque dur tombe en panne, les données seront parfaitement conservées dans l'autre miroir RAID 0.

L'inconvénient de ce système est l'évolutivité, lorsque nous ajoutons un disque supplémentaire dans un sous-niveau, nous devrons également faire de même dans l'autre. En outre, la tolérance aux pannes nous permettra de casser un disque différent dans chaque sous-niveau, ou d'en casser deux dans le même sous-niveau, mais pas d'autres combinaisons, car nous perdrions des données.
 

RAID 1+0 ou RAID 10

Nous serions alors dans le cas inverse, également appelé RAID 10 ou partitionnement en miroir. Nous aurons maintenant un niveau principal de type 0 qui répartit les données stockées entre les différents sous-niveaux. A leur tour, nous aurons plusieurs sous-niveaux de type 1 qui seront chargés de répliquer les données sur les disques durs qu'ils contiennent.

Dans ce cas, la tolérance aux pannes nous permettra de casser tous les disques d'un sous-niveau sauf un, et il faudra qu'il reste au moins un disque sain dans chacun des sous-niveaux pour ne pas perdre d'informations.
 

RAID 50

Bien sûr, nous pourrions continuer pendant un moment à faire des combinaisons possibles de RAID, toutes plus compliquées les unes que les autres, pour obtenir une redondance, une fiabilité et une vitesse maximales. Nous verrons également le RAID 50, qui est un niveau RAID 0 principal qui divise les données des sous-tiers configurés en RAID 5, avec leurs trois disques durs respectifs.

Dans chaque bloc RAID 5, nous aurons une série de données avec leur parité correspondante. Dans ce cas, un disque dur peut tomber en panne dans chaque RAID 5, et il garantira l'intégrité des données, mais si plusieurs tombent en panne, nous perdrons les données qui y sont stockées.
 

RAID 100 et RAID 101

On peut avoir non seulement une arborescence à deux niveaux, mais aussi une arborescence à trois niveaux, et c'est le cas du RAID 100 ou 1+0+0. Il est constitué de deux sous-niveaux RAID 1+0 divisés à leur tour par un niveau principal également en RAID 0.

De la même manière, nous pouvons avoir un RAID 1+0+1, formé par plusieurs sous-niveaux RAID 1+0 mis en miroir par un RAID 1 comme RAID principal. Leur vitesse d'accès et leur redondance sont très bonnes, et ils offrent une bonne tolérance aux pannes, bien que la quantité de disques à utiliser soit considérable par rapport à l'espace disponible.

Les avantages d'un système RAID

Haute tolérance aux pannes : Avec un RAID, nous pouvons obtenir une bien meilleure tolérance aux pannes que si nous n'avions qu'un seul disque dur. Cela sera conditionné par les configurations RAID que nous adoptons, car certaines sont orientées pour fournir une redondance et d'autres simplement pour obtenir une vitesse d'accès.

Amélioration des performances de lecture et d'écriture : comme dans le cas précédent, il existe des systèmes visant à améliorer les performances en divisant les blocs de données en plusieurs unités, pour les faire travailler en parallèle.

Possibilité de combiner les deux propriétés précédentes : les niveaux RAID peuvent être combinés, comme nous le verrons plus loin. De cette façon, nous pouvons profiter de la vitesse d'accès de l'un et de la redondance des données de l'autre.

Bonne évolutivité et capacité de stockage : un autre de leurs avantages est qu'il s'agit généralement de systèmes facilement évolutifs, en fonction de la configuration que nous adoptons. En outre, nous pouvons utiliser des disques de nature, d'architecture, de capacité et d'âge différents.

Les inconvénients d'un système RAID

Un système RAID ne garantit pas la récupération en cas de catastrophe : comme nous le savons, il existe des applications qui peuvent récupérer des fichiers à partir d'un disque dur endommagé. Le RAID nécessite des pilotes différents et plus spécifiques qui ne sont pas nécessairement compatibles avec ces applications. Ainsi, en cas de défaillance d'une chaîne ou de plusieurs disques, nous pouvons avoir des données irrécupérables.

La migration des données est plus compliquée : cloner un disque avec un système d'exploitation est assez simple, mais le faire avec un RAID complet vers un autre est beaucoup plus compliqué si vous ne disposez pas des bons outils. C'est pourquoi la migration des fichiers d'un système à un autre pour la mise à niveau devient une tâche parfois insurmontable.

Coût initial élevé : la mise en œuvre d'un RAID avec deux disques est simple, mais si l'on veut des matrices plus complexes avec redondance, les choses se compliquent. Plus il y a de disques, plus le coût est élevé, et plus le système est complexe, plus il faut de disques.

Vous avez des questions ou bien besoin d'informations complémentaires concernant notre article sur les disques durs RAID ? Pour cela, nous vous proposons de remplir le formulaire de demande ci-dessous ou bien sinon de nous envoyer directement un email à l'adresse info@ip-systemes.fr. Dans tous les cas, toutes nos équipes d'experts en Informatique Industrielle se tiennent à votre disposition afin de vous répondre dans les meilleurs délais.

Demande d'informations complémentaires