Redundant Array of Independent Disks

(war: Redundant Array of Inexpensive Disks)

Glossar

Striping: Aufteilen der Datenspeicherung auf mehr als 1 Disk

Parity: Fehlerkorrekturdaten (meist XOR)

Mirror: Spiegel-Daten

BL-Parity: Block-Level-Parity (Boy Love, Boss Level als Alternative fuer 0 Punkte in der Klausur) Parity auf Block-Level-Ebene (Hardware; Blocks sind, was HDs schreiben) Parity müsste blockweise laufen, sonst Datenverlust nicht abfangbar

Spare: Platte als Drop-In (Ersatz) fuer Ausgefallene

Hot-Spare: Spare fuer Auswechseln im lfd Betrieb, idR schon drin

Leg: Ober- oder Unter-Raids, vgl zB RAID 10

MTBF: mean time between failures

Kurze Auffrischung: Software vs Hardware

RAID 0

RAID 1

RAID 5

RAID 6

RAID 10

RAIDn

RAID (n,m) - RAID(n,0) => RAID 0 - RAID(n,n-1) => RAID 1 - RAID(n,1) => RAID 5 - RAID(n,2) => RAID 6

Lesegeschwindigkeit = n × Lesegeschwindigkeit der Einzelplatte Schreibgeschwindigkeit = (n − m) × Schreibgeschwindigkeit der Einzelplatte Kapazität = (n − m) × Kapazität der Einzelplatte

mit n: Anzahl Platten und m: Anzahl Platten, die ohne Datenverlust ausfallen duerfen

Alternative: NRAID

Plattenverbund ohne Raid: kein LVM! unterschiedliche Platten verwendbar

mehr Speicher als bei RAID 0 (nicht laenger die Kapazitaet der kleinsten Plodde fuer alle Disks) keine Redundanz Kapazitätsgewinn ohne Leistungsgewinn single point of failure: 1 Platte faellt aus, alles auf der Platte faellt weg!

"Manchmal fährt man besser, wenn man häufiger Backups macht und/oder ein Ersatzsystem bereitstellt und die Daten regelmäßig spiegelt."

weiterführende Informationen

Video1 zu RAID

Video2 zu RAID

Alternative: SPAN

Alternative: JBOD

Alternative/Außerdem: LVM

FAZIT

Wikipedia sez:
In der Praxis hat das schlechtere Worst-Case-Verhalten und die zeitintensive Parityberechnung von RAID 5 merklich negative Einflüsse nur dann, wenn viele, schnelle und kleine Schreibzugriffe erfolgen. Bei Zugriffen als Fileserver überwiegen dann die Vorteile von RAID 5 der höheren Lesegeschwindigkeit und günstigeren Kosten pro Kapazität. Bei performanceorientierten Datenbanksystemen wird doch RAID beziehungsweise 10 empfohlen, da hier keine Paritätsberechnung stattfindet und die Blockgröße nicht relevant ist. Bei neueren Festplatten, deren atomare Blockgröße oft 4.096 Byte beträgt, gewinnt die schlechtere Worst-Case-Effizienz weiter an Bedeutung. Für alle performanceorientierten Systeme mit Schutz vor Datenverlust bei Plattenausfall gilt der deutlich erhöhte Kostenfaktor. Für den sicheren Betrieb wird ein hochwertiger Hardware-RAID-Controller mit entsprechender Hardware-Cacheabsicherung (BBU) benötigt. Dafür erhält man ein deutlich sichereres und schnelleres System. Viele Hersteller von Datenbanksystemen empfehlen für ihre Systeme RAID 1 oder 10, zumindest für die schreibintensiven Log-Dateien.

(Arbeits-)Fragen

  1. Worauf liegen die zwei Augenmerke, welche zwei Sachen (Gegensatz?) moechte man erreichen?
  2. Welche RAIDs sind (arbeits-/klausur)-relevant?
  3. Was ist der Unterschied zwischen Hardware und Software RAID?
  4. Was ist ein Mirror?
  5. Was ist Parity?
  6. Wieviele Disks brauche ich minimum für RAID?
  7. Wieviele Disks kann ich maximal nehmen?
  8. Was muss ich bei Ausfall des RAID-Systems beachten/bedenken, wogegen ich im Zweifel eh nix machen kann ausser beten?