Quando si parla di backup e disaster recovery entrano in gioco due fondamentali termini di misurazione dell'efficacia: il Recovery Point Objective (RPO) e il Recovery Time Objective (RTO). Si tratta di due parametri indicatori che si associano sia alle esigenze del business sia alle tecnologie che sono impiegate nelle attività di tutela e ripristino.
RTO indica per quanto tempo è possibile fare a meno di una specifica applicazione o funzionalità informatica. Questo parametro indica quindi la durata della massima interruzione ammissibile o comunque tollerabile dal business aziendale. RPO riguarda invece più direttamente la componente del lavoro delle persone, indicando quanto spesso viene salvata l'immagine dei dati e quindi, di concerto, quanta parte del lavoro fatto si è disposti a perdere in caso di guasto.
Il Recovery Point Objective (RPO) è il tempo che intercorre tra la produzione del dato e la sua messa in sicurezza. C’è infatti un certo lasso di tempo in cui il dato, già prodotto, non è ancora soggetto ad attività di replica o di backup: un incidente di sicurezza, una cancellazione accidentale o un guasto al sistema di storage porta inevitabilmente alla sua perdita definitiva.
RPO significa decidere quanto tempo deve trascorrere tra una replica e l’altra, ovvero quanti dati l’azienda può permettersi di perdere senza compromettere il proprio business. o. Per fare un esempio concreto, sulle transazioni finanziarie dovrebbe essere zero, mentre su altri dati come i contenuti delle email è possibile essere più tolleranti. Insieme all’RTO, l’RPO è uno degli indicatori, ma anche degli obiettivi, più importanti delle strategie aziendali di business continuity.
L’RPO non ha un obiettivo standard, ma dipende da un processo all’altro. Oggi è possibile lavorare senza perdita di dati, ma a patto di importanti investimenti. Per questo motivo le aziende hanno RPO diversi sulla base della tipologia di dato da tutelare, di applicazione e soprattutto di processo, cercando il miglior bilanciamento tra la continuità del business e i costi.
L’RTO (Recovery Time Objective) indica per quanto tempo è possibile fare a meno di una specifica applicazione, dato o funzionalità informatica. Questo parametro indica quindi la durata della massima interruzione ammissibile o comunque tollerabile dal business aziendale. Il parametro si applica sia alle attività di disaster recovery, laddove assume il significato appena visto, sia nell’ambito del backup, nei confronti del quale identifica la rapidità con cui devono essere eseguite le operazioni di ripristino delle repliche.
Il calcolo dell’RTO è molto simile a quello dell’RPO. Il management deve capire, in questo caso, per quanto tempo può fare a meno i di uno specifico processo senza incorrere in problemi di compliance, inadempimenti contrattuali o danni reputazionali. Vanno quindi valutati i processi e il loro grado di criticità, così come è essenziale identificare i rischi, le probabilità e gli impatti di un’eventuale interruzione. Definito l’RTO, seguono le configurazioni del backup e del disaster recovery.
A seconda delle tecnologie informatiche e delle pratiche d’uso adottate, RPO e RTO possono essere molto diversi. Sistemi di backup programmati per salvare i dati dopo l’orario di chiusura degli uffici si associano a numeriche di RPO e RTO molto più alte rispetto a quelle di un data center dotato di sistemi cluster in failover, sincronizzati in tempo reale.
Per esempio, se si programma l’attività di backup per le ore 19 e un allagamento danneggia il server, si perde il lavoro fatto fino al momento dell’ultimo backup. Perdita nulla se l’incidente accade di notte con gli uffici chiusi, massimo e pari all’intera giornata di lavoro se avviene un’istante prima che sia completato il nuovo backup. In questo contesto, RPO è il backup del giorno precedente. RTO dipende invece dal tempo che si impiega a riprendere il lavoro, attraverso il reperimento di un sistema compatibile non danneggiato e il ripristino di applicazioni, configurazioni e dati salvati in precedenza.
Per fortuna in azienda non tutto è critico allo stesso modo; gli obiettivi di RPO e RTO sono molto diversi se si mette a confronto il PC di un dipendente con il server di un reparto. Le attività aziendali non hanno tutte le stesse esigenze. Un ufficio del personale può, per esempio, accettare interruzioni del lavoro con minor danno rispetto a un reparto di produzione. Rimandare un rimborso o ricostruire i conteggi di ferie e trasferte è oneroso, ma è meno grave se confrontato al danno economico e d’immagine che può causare un blocco della produzione o della logistica.
Poiché le tecnologie a servizio della salvaguardia di dati e applicazioni costano, nella definizione di un piano di disaster recovery è utile conoscere nel dettaglio i requisiti di RTO e RPO desiderati per fare scelte compatibili con risorse e budget disponibili. Le tecnologie di backup a nastro si associano con costi che sono relativamente bassi, ma spesso con valori RTO e RPO non più compatibili con le attuali esigenze di business.
I moderni sistemi di storage a dischi o flash memory sono dotati di funzioni snapshot che consentono di ripristinare e salvaguardare i dati in modo logico e istantaneo, senza attendere chiusure, quindi con la frequenza più adatta agli obiettivi di RPO e allo spazio dati che è disponibile. Allo stesso modo, server in cluster con applicazioni virtualizzate in container possono a ripristinare in meno di un minuto i job applicativi arrestati per problemi hardware o software.
All’estremo più alto restano le infrastrutture data center distribuite, con server e storage ridondati e sincronizzati in tempo reale, capaci di garantire lo switch dei servizi in pochi secondi e il recupero dai log dei job eventualmente persi nel passaggio. Le infrastrutture impiegate oggi dai principali service provider hanno le caratteristiche appena descritte: questo ne fa una opzione da considerare sia per i processi primari che per i servizi di backup e disaster recovery nel cloud. Un’opzione che, al pari dei servizi gestiti internamente, richiede un’esatta conoscenza dei requisiti RPO e RTO per non sprecare denaro, o peggio, mettere a rischio l’azienda.