RAID5-Rekonstruktion bei zwei kaputten Platten

In vielen Systemen, in denen mehr als zwei Festplatten durch einen RAID-Verbund zusammengeschlossen sind, kommt RAID5 zum Einsatz: Dieser profitiert von einer deutlich gesteigerten Lesegeschwindigkeit bei einer nutzbaren Kapazität von (n-1)*s mit n = Anzahl der Festplatten, s = Größe der kleinsten Platte. Durch die verteilte Speicherung von Paritätsinformationen wird Datensicherheit bei Ausfall einer Festplatte gewährleistet. Dabei wird im Fehlerfall nach Aktivierung einer Spare-Disk oder Austausch der fehlerhaften Platte der RAID-Verbund rekonstruiert. Sind allerdings zur selben Zeit zwei Platten defekt, so ist in der Regel der Verbund nicht rekonstruierbar und alle Daten sind verloren.

Mit Linux und etwas Glück konnte ich gerade einen RAID5 rekonstruieren, in dem zwar zeitversetzt, aber quasi doch gleichzeitig, zwei Platten ausfielen:

Durch einen Softwarefehler wurde eine der sieben Platten im RAID5-Verbund vollständig überschrieben, welcher deshalb also neu erstellt werden mußte (restripe). Noch während der Restripe-Phase fiel dann eine zweite Platte aus, diesmal mit physikalischem Defekt. Der RAID-Verbund wurde daraufhin deaktiviert und ließ sich auch unter Zwang nicht mehr aktivieren. Da glücklicherweise „nur“ fehlerhafte Sektoren auf der Platte gefunden worden waren, also Lager, Motor und Steuerelektronik noch korrekt funktionierten, wurde sie fix zusammen mit einer etwas größeren, fehlerfreien in einen anderen PC gebaut und KNOPPIX gebootet.

Für das notwendige Backup der Rohdaten sah ich nach etwas Recherche aus geschwindigkeitstechnischen Gründen vom guten alten dd ab und kompilierte mir schnell das vom TestDisk-Autor empfohlene ddrescue, was unter KNOPPIX 5.2 auch ohne Probleme funktionierte.

Mit einem

ddrescue -v -r 1 /dev/hdb /dev/hda ddrescued.log

wurde dann der Backupvorgang gestartet, der drei (gefühlt: 47) Stunden später schließlich auch 5 MB an fehlerhaften Daten erwähnte, die nicht gesichert werden konnten. Nach abschließendem Wiedereinbau der neuen Platte in den RAID-Rechner bootete dieser einwandfrei, versuchte dann erneut ein Restriping und schloß selbiges erfolgreich ab. Alle Daten (bis auf 5 MB) sind nun wieder lesbar.

*puh*

Tags: , ,

3 Antworten zu “RAID5-Rekonstruktion bei zwei kaputten Platten”

  1. Oliver says:

    Super.

    AntwortenAntworten
  2. Rico says:

    Held!

    AntwortenAntworten
  3. speaker says:

    ImmerDieseEinWortKommentare. :P

    AntwortenAntworten

Eine Antwort hinterlassen