Novità e Approfondimenti su Cloud e Data Center - CDLAN

RTO e RPO spiegati: i pilastri fondamentali del Disaster Recovery

Scritto da CDLAN | 28.11.2024

Nonostante l’infrastruttura IT sia costantemente soggetta a minacce, tra cui gli attacchi cyber e gli eventi naturali contro il data center, le aziende hanno a disposizione diversi strumenti per preservare la continuità del proprio business, o almeno per fare in modo che la discontinuità e la perdita di dati risultino tollerabili e, in qualche modo, prevedibili. RTO ed RPO entrano in gioco proprio a tal fine.

Non tutti i processi sono business critical

In un mondo ideale, l’infrastruttura IT e gli applicativi su cui si basa il business sono sempre disponibili e i dati sempre accessibili. Tuttavia, la realtà è molto diversa: l’operatività degli ambienti IT, che si traduce in continuità del business, è soggetta a talmente tante minacce da imporre l’adozione di strategie di gestione del rischio. 

Oggi, le tecnologie moderne, unite a data center estremamente resilienti e a strategie di continuità operativa ben implementate, permettono di ridurre il rischio di discontinuità al minimo. Non di azzerarlo del tutto, ma certamente di portarlo a livelli infinitesimali. Tuttavia, per garantire l’accessibilità di dati e applicazioni a fronte di imprevisti critici (es, un terremoto nella zona del data center) sono necessarie non solo competenze e asset all’avanguardia, ma anche una spesa non indifferente; per questo motivo, le aziende riservano l’obiettivo dello zero downtime ai loro processi critici, quelli che non possono mai fermarsi perché un’interruzione avrebbe un impatto fortissimo sulla compliance, sulla loro reputazione e sulla relazione con i clienti. 

Fortunatamente, non tutti i processi sono business critical e non tutti i dati sono essenziali per l’azienda e/o per la conformità a leggi, policy e regolamenti. Ed è proprio su questi processi che i concetti di RTO e RPO, pur aventi valenza universale (e quindi applicabili anche al mondo core), assumono la massima centralità.

RTO e RPO, la parola chiave è personalizzazione

Si è detto che un’eccellente strategia di continuità del business non persegue lo zero downtime per tutti i processi e le applicazioni. L’azienda effettua infatti una business impact analysis proprio per capire l’impatto della discontinuità sul business aziendale e per comprendere quali processi potrebbero tollerare un certo livello di downtime e/o di perdita di dati senza un impatto critico sul futuro dell’azienda. 

Caso per caso, o meglio processo per processo, l’azienda può definire quanto downtime tollerare. All’interno dei piani di disaster recovery, che sono fondamentali proprio per definire le procedure di ripristino a seguito di incidenti critici, si definisce quindi il Recovery Time Objective (RTO) come il tempo massimo accettabile per il ripristino di una funzione o di un sistema dopo un'interruzione. Come detto, andiamo da una quantificazione in secondi per un processo estremamente rilevante ai fini del business a qualche ora per attività non-core e dall’impatto relativo sull’azienda in senso lato. 

Ovviamente, la struttura deve predisporre tutti gli strumenti affinché sia possibile garantire l’RTO in caso di incidente, come per esempio tutte le ridondanze del caso, i backup, le repliche di dati e applicazioni in un secondo data center lontano dal primo. Inoltre, cosa tutt’altro che secondaria, l’azienda deve definire in modo preciso tutti i ruoli e le procedure di disaster recovery da mettere in campo in caso di incidente. Se l’azienda opera con competenza e dispone di asset e delle tecnologie giuste, può rispettare l’RTO e differenziarlo processo per processo.

Recovery Point Objective a salvaguardia dei dati aziendali

RTO e RPO sono solitamente associati, essendo gli indicatori più importanti nell’ambito della continuità del business e, soprattutto, del disaster recovery. A differenza del primo, RPO (Recovery Point Objective) non riguarda direttamente l’accessibilità dei sistemi software (applicazioni) che alimentano il business, ma la preservazione dei dati. Di fronte a un downtime e alla necessità di ripristino dei sistemi, infatti, l’azienda soffre una perdita di dati che corrisponde al lasso di tempo intercorrente tra l'ultimo backup e l'evento di interruzione. L'RPO definisce dunque la quantità massima di dati che l'azienda può permettersi di perdere senza un impatto critico sul proprio business e guida la frequenza con cui devono essere eseguite le repliche e i backup dei dati stessi. 

Anche in questo caso è possibile puntare all’assenza di perdita di dati, ma conviene – data la maggiore complessità e il costo molto elevato – riservarla alle attività core della propria azienda e/o a quelle maggiormente regolate. Si pensi, ad esempio, alle transazioni bancarie, che non possono tollerare nessuna perdita di dati pena un forte danno per l’istituto. In altri casi, un certo livello di discontinuità è tollerabile e, esattamente come per l’RTO, l’azienda definisce e implementa tutte le misure necessarie per garantirlo, dai backup regolari alla replica dei dati in tempo reale o near-real-time tra datacenter o verso soluzioni cloud per garantire che questi siano sempre aggiornati e disponibili in caso di interruzione.