Ricostruzione del RAID e recupero dati tramite software a confronto: quale ripristina i dati più rapidamente?

Quando un disco in un array RAID si guasta, l’amministratore del server o del NAS deve prendere una decisione critica: avviare una normale ricostruzione oppure utilizzare un software di recupero dati RAID. Una ricostruzione tradizionale può richiedere da alcune ore a una settimana, a seconda della capacità dei dischi e del livello RAID, lasciando il sistema esposto a ulteriori guasti. L’alternativa è il software, soluzione particolarmente rilevante in presenza di guasti multipli ai dischi o quando l’azienda non può permettersi tempi di inattività prolungati.

Ricostruzione del RAID e recupero dati tramite software a confronto: quale ripristina i dati più rapidamente?

Contenuti

  1. Che cos’è la ricostruzione / risincronizzazione RAID
  2. Quanto tempo richiede la ricostruzione di un RAID
  3. Rischi di una ricostruzione RAID prolungata e l'alternativa del recupero dati tramite software
  4. Come recuperare i dati da array RAID danneggiati tramite software

Questo articolo analizza i tempi di recupero reali per diverse configurazioni RAID, confronta la ricostruzione hardware con gli approcci basati su software e aiuta a scegliere la strategia ottimale per il proprio scenario.

Che cos’è la ricostruzione / risincronizzazione RAID

Una ricostruzione RAID (anche detta ricostruzione o risincronizzazione) è il processo mediante il quale un controller o un software RAID ricrea i dati mancanti su un disco sostitutivo utilizzando i dischi restanti dell’array (ad es. tramite parità o mirroring). Ciò consente all’array di tornare da uno stato degradato a una condizione di piena ridondanza.

Quando un disco dell’array si guasta, il controller RAID lo contrassegna come guasto e l’array entra in modalità degradata. Dopo l’installazione di un nuovo disco, il controller ricostruisce l’array leggendo i dati dai dischi sani rimanenti e calcolando quelli da scrivere sul nuovo disco in base allo schema a parità o a mirroring, a seconda del livello RAID.

Le ricostruzioni possono essere automatiche (attivate all’inserimento di un nuovo disco in un array degradato) o manuali (avviate da un amministratore), a seconda del controller o del software RAID.

Durante la ricostruzione l’array resta operativo, ma le prestazioni si riducono e non vi è protezione da ulteriori guasti.

La velocità di ricostruzione dipende da diversi fattori critici: capacità dei dischi (quelli più capienti richiedono più tempo), livello RAID (RAID 6 richiede più tempo di RAID 5 a causa della doppia parità), carico di sistema corrente (l’I/O attivo rallenta sensibilmente il processo) e tipo di controller.

I controller RAID hardware in genere superano le implementazioni software grazie a un processore dedicato e a una cache. Anche così, i controller ad alte prestazioni devono bilanciare la velocità di ricostruzione con la gestione delle operazioni di I/O in corso. Molti sistemi consentono di configurare la priorità della ricostruzione: una priorità alta accelera il ripristino della ridondanza ma riduce le prestazioni applicative; una priorità bassa minimizza l’impatto sui carichi di produzione ma può prolungare la ricostruzione fino a diversi giorni. È particolarmente importante comprendere che durante la ricostruzione il sistema è in uno stato critico: un ulteriore guasto di un disco in RAID 5 o due ulteriori guasti in RAID 6 comporta la perdita totale dei dati senza possibilità di recupero automatico.

Quanto tempo richiede la ricostruzione di un RAID

Il tempo di ricostruzione può variare da poche ore a diversi giorni o più per array di grandi dimensioni.

Di seguito una formula semplificata spesso usata per stimare il tempo di ricostruzione:

Rebuild time = (Data volume / Disk read speed) × Overhead factor
  • RAID 1: fattore = 1,0
  • RAID 5: fattore = 1,4 (40% di tempo aggiuntivo per il calcolo della parità)
  • RAID 6: fattore = 1,8 (80% di tempo aggiuntivo per il calcolo della doppia parità)

La velocità di ricostruzione dipende dal tipo di dischi e di controller, ma con HDD moderni si attesta mediamente su 50–100 MB/s in assenza di carico. Ciò significa che ricostruire 1 TB di dati a 80 MB/s richiede circa 3,5 ore. Tuttavia, i tempi reali sono sempre superiori a causa dell’overhead del calcolo della parità, della verifica dei dati e della frammentazione.

RAID 1, basato su mirroring, si ricostruisce relativamente in fretta copiando i dati byte per byte dal disco sano a quello nuovo. Per un mirror a due dischi da 1 TB, l’operazione richiede 3–6 ore in funzione della velocità dei dischi. RAID 5 richiede sensibilmente più tempo perché deve leggere i dati da tutti i dischi dell’array e calcolare la parità. Con la configurazione minima a tre dischi, il controller deve leggere 2 TB di dati, calcolare la parità e scrivere 1 TB sul nuovo disco, per un totale di 6–12 ore.

RAID 6, con doppia parità, richiede ancora più tempo perché calcola due blocchi di parità indipendenti. Una configurazione minima a quattro dischi in genere si ricostruisce in 8–16 ore, poiché il controller elabora più dati ed esegue operazioni più complesse. RAID 10, che combina mirroring e striping, si ricostruisce più rapidamente di RAID 5 e 6 perché deve solo copiare dal mirror senza calcolare la parità.

Stime dei tempi di ricostruzione per array con dischi da 1 TB

Livello RAID Numero di dischi Capacità dell’array Tempo di ricostruzione (in assenza di carico)
RAID 0 2 2 TB Nessuna ricostruzione*
RAID 1 2 1 TB ~3,5 ore
RAID 5 3 2 TB ~7 ore
RAID 5 4 3 TB ~10,5 ore
RAID 5 5 4 TB ~14 ore
RAID 6 4 2 TB ~10 ore
RAID 6 5 3 TB ~15 ore
RAID 6 6 4 TB ~20 ore
RAID 10 4 2 TB ~3,5 ore
RAID 10 6 3 TB ~3,5 ore
RAID 10 6 3 TB ~3,5 ore

*RAID 0 non offre ridondanza: in caso di guasto di un disco, parte dei dati potrebbe essere recuperabile, ma non tutti.

Nota: Le stime presuppongono un throughput medio di ricostruzione di 80 MB/s per HDD a 7200 RPM e tengono conto dell’overhead di parità (~40% per RAID 5, ~80% per RAID 6). Con SSD, i tempi possono essere inferiori di 2–3 volte. Sotto carico di produzione, i tempi aumentano di 2–4 volte.

Rischi di una ricostruzione RAID prolungata e l’alternativa del recupero dati tramite software

Rischi di una ricostruzione RAID prolungata

La ricostruzione crea una finestra critica di vulnerabilità in cui il sistema è particolarmente esposto a guasti catastrofici.

La minaccia principale è un secondo guasto a un disco durante la ricostruzione. In RAID 5, un ulteriore disco guasto comporta la perdita totale dei dati, poiché l’array opera già in modalità degradata senza ridondanza.

La probabilità di questo scenario aumenta per vari motivi: i dischi di un array sono di norma acquistati insieme e hanno la stessa età e lo stesso ciclo di lavoro, operano in condizioni identiche e la ricostruzione impone un carico elevato ai dischi rimanenti, accelerando l’insorgenza di difetti latenti.

Le URE (Unrecoverable Read Errors, errori di lettura non recuperabili) rappresentano un rischio specifico: i settori danneggiati possono essere rilevati solo durante le letture dell’intero volume eseguite nella fase di ricostruzione.

Se il controller incontra una URE durante la ricostruzione di un RAID 5, il processo può fallire completamente, poiché le letture mancanti rendono impossibile calcolare la parità corretta per il nuovo disco.

Quanto più a lungo dura la ricostruzione, tanto maggiore è il rischio di un guasto catastrofico dell’array.

Recupero RAID basato su software: un approccio alternativo

Un approccio alternativo consiste nell’utilizzare software di recupero dati per array RAID danneggiati o guasti, senza eseguire una ricostruzione standard basata sul controller. A differenza della ricostruzione hardware tramite controller, questi strumenti operano a livello di file system e dati, analizzano la struttura dell’array ed estraggono informazioni anche da configurazioni gravemente compromesse.

Il principio fondamentale è la ricostruzione della geometria RAID: il software scansiona i dischi disponibili, identifica i parametri dell’array (numero di dischi, dimensione dello stripe, ordine di striping, schema della parità), ricostruisce la struttura logica e consente l’accesso ai file senza modificare fisicamente i dischi.

Il recupero tramite software è preferibile — o rappresenta l’unica opzione — in diversi scenari critici.

  • Guasto di due o più dischi (RAID 5) o di tre o più (RAID 6)
  • Guasto del controller RAID o perdita della configurazione
  • Dati critici necessari con urgenza; non c’è tempo per una ricostruzione
  • Un tentativo di ricostruzione è già fallito a causa di URE o altri errori
  • Array eliminato o reinizializzato per errore
  • Migrazione dei dati da hardware obsoleto o instabile
  • Necessità di un tentativo di recupero sicuro senza rischiare ulteriori danni

Come recuperare i dati da array RAID danneggiati tramite software

Il recupero dei dati da un array RAID danneggiato o non funzionante non deve essere complesso. La maggior parte degli strumenti adotta lo stesso approccio: collegare i dischi dell’array a un computer (oppure collegarsi all’array tramite SSH), eseguire una rapida analisi e quindi salvare i dati recuperati in una destinazione sicura, ad esempio un nuovo array RAID.

Si consideri come esempio il processo con RS RAID Retrieve.

RS Raid Retrieve

RS Raid Retrieve

Ripristino automatico di qualsiasi tipo di array RAID

Disponibile per: Windows, macOS, Linux

Fase 1. Collegare i dischi e inizializzare

Dopo aver collegato fisicamente i dischi dell’array guasto a un computer funzionante, avviare il software di recupero. Eseguirà una ricerca automatica delle configurazioni RAID sui dischi collegati o sulle immagini aggiunte. Gli array individuati verranno aggiunti alla finestra principale.

Recupero dati RAID 5 con due dischi mancanti

Se sono presenti dischi danneggiati con letture instabili, creare prima le immagini dei dischi.

Fase 2. Analizzare il file system dell’array

Eseguire una Scansione rapida dell’array. Il software analizzerà il file system, ricostruirà la struttura delle directory, enumererà i metadati dei file e mostrerà nell’interfaccia l’albero dei dati recuperati.

In questa fase è possibile valutare lo stato dei dati: esplorare gli elenchi dei file, verificarne l’integrità e visualizzare in anteprima i singoli file.

Recupero dati RAID 5 con due dischi mancanti

La scansione rapida opera sui metadati del file system e di norma si completa in 20–60 minuti per array da 1–4 TB. Se la scansione rapida non individua tutto il necessario (ad esempio per danni al file system), la maggior parte degli strumenti offre una scansione completa, un processo più lungo.

Fase 3. Estrarre e salvare i dati

Selezionare i dati da trasferire su un nuovo array RAID o su un disco con capacità sufficiente e salvarli.

Il tempo di copia è proporzionale al volume dei dati: circa 20 minuti per terabyte con una velocità media di 850 MB/s. Il software ricostruisce i dati al volo, leggendo dai dischi disponibili e, quando necessario, rigenerando i blocchi mancanti tramite calcolo di parità.

Stime dei tempi di recupero RAID basate su software

Livello RAID Numero di dischi Capacità dell’array Tempo di recupero*
RAID 0 2 2 TB ~40 minuti
RAID 1 2 1 TB ~20 minuti
RAID 5 3 2 TB ~40 minuti
RAID 5 4 3 TB ~60 minuti
RAID 5 5 4 TB ~80 minuti
RAID 6 4 2 TB ~40 minuti
RAID 6 5 3 TB ~60 minuti
RAID 6 6 4 TB ~80 minuti
RAID 10 4 2 TB ~40 minuti
RAID 10 6 3 TB ~60 minuti
RAID 10 6 3 TB ~80 minuti

* Il tempo indicato comprende ricostruzione ed estrazione dopo che il software ha identificato la configurazione dell’array. Stima basata su una velocità media di lettura/ricostruzione di ~50 GB/min (850 MB/s) con software moderno su un sistema ad alte prestazioni.

Quando si sceglie un software per il recupero RAID, verificare il supporto per il livello RAID in uso, la compatibilità con il sistema operativo, l’anteprima dei file prima dell’acquisto, la possibilità di lavorare a partire da immagini disco per un recupero più sicuro e la qualità dell’assistenza tecnica.

Una rassegna dei migliori strumenti—funzionalità, vantaggi e svantaggi, con confronto di funzionalità e prezzi—è disponibile qui: I migliori software per il recupero dati da RAID.

Confronto delle prestazioni: ricostruzione vs. recupero software

Capacità dell’array Ricostruzione RAID (in assenza di carico) Recupero basato su software
1 TB ~3,5 ore ~20 minuti
2 TB ~7 ore ~40 minuti
3 TB ~10,5 ore ~60 minuti
4 TB ~14 ore ~80 minuti

Importante: Il recupero basato su software consente un accesso rapido ai dati per l’estrazione, ma non ripristina un array RAID funzionante. Per riportare il sistema in esercizio è necessario ulteriore tempo per creare un nuovo array e copiare nuovamente i dati recuperati.

La scelta tra una ricostruzione standard e l’uso di software dipende dal caso specifico, dallo stato dell’array e dalla criticità dei dati. La ricostruzione hardware resta una soluzione affidabile per guasti semplici di un singolo disco quando il sistema può operare in modalità degradata per il tempo necessario.

Domande frequenti

Il tempo di ricostruzione di un RAID dipende dalle dimensioni dei dischi, dal livello RAID, dalle prestazioni del controller e dal carico di sistema. Un array RAID 5 da 1 TB può richiedere dalle 6 alle 12 ore, mentre array più grandi da 10–16 TB potrebbero richiedere diversi giorni per una ricostruzione completa, soprattutto in presenza di un elevato carico di I/O.
Le ricostruzioni RAID lente sono spesso causate da dischi di grande capacità, da una elevata attività del sistema, da risorse del controller limitate o dal sovraccarico del calcolo della parità. Ridurre i carichi di lavoro attivi e aumentare la priorità di ricostruzione può ridurre significativamente il tempo necessario per la ricostruzione.
Sì. È possibile accelerare le ricostruzioni pianificandole durante periodi di bassa attività, aggiornando i dischi a prestazioni superiori o SSD, abilitando una velocità di ricostruzione più alta nel controller RAID e utilizzando motori RAID moderni ottimizzati per la ricostruzione parallela.
Se durante la ricostruzione di un RAID 5 si verifica il guasto di un secondo disco, tutti i dati vanno persi, poiché la ridondanza è persa. Il RAID 6 può tollerare un ulteriore guasto, ma il rischio di perdita totale dei dati aumenta comunque con la durata della ricostruzione. Mantieni sempre backup recenti prima e durante la ricostruzione.
lascia un commento

Articoli correlati

Come Creare un RAID nel BIOS di una Scheda Madre Asus sulla Piattaforma AMD
Come Creare un RAID nel BIOS di una Scheda Madre Asus sulla Piattaforma AMD
Come Creare un RAID Hardware su una Scheda Madre? Ogni produttore di schede madri offre la propria interfaccia, organizzazione e funzioni BIOS. Pertanto, il processo di creazione di un array di dischi varierà a seconda della scheda madre. Il RAID … Continue reading
Come recuperare i dati persi da un array RAID 10?
Come recuperare i dati persi da un array RAID 10?
In questo articolo esamineremo come recuperare dati persi da un array RAID 10.
Recupero dati da X-RAID Netgear ReadyNAS
Recupero dati da X-RAID Netgear ReadyNAS
Come recuperare i dati da X-RAID Netgear? La tecnologia di creazione di un array X-RAID sui dispositivi NAS Netgear ReadyNAS ha certi vantaggi ma presenta anche delle sfumature proprie. E quando si tratta di recupero dati, è necessario il supporto … Continue reading
Recupero di file da unità SSD
Recupero di file da unità SSD
Circola molta informazione controversa riguardo al recupero dei dischi SSD. Lo scopo di questo articolo è tentare di chiarire cosa, quando e come può essere recuperato nel caso specifico dei dischi SSD.
Online Chat with Recovery Software