Per prima cosa, posizioniamo correttamente il disaster recovery plan nell’ambito più ampio della business continuity (e resilience) aziendale. Per definizione (TechTarget), si tratta di un “approccio documentato e strutturato che descrive come un’organizzazione può riprendere rapidamente il lavoro dopo un incidente non pianificato”.
La principale differenza rispetto a un piano di continuità del business è, appunto, il suo posizionamento nell’ambito della resilienza d’impresa. Partendo dal presupposto che oggi i processi su cui si basa l’attività d’impresa fanno totale affidamento sui sistemi e sull’infrastruttura IT sottostante, il disaster recovery plan si occupa in modo specifico di minimizzare gli effetti di qualsiasi disaster sull’operatività dei sistemi stessi e sull’accessibilità dei dati.
Disegnando un business continuity management system (BCMS) come una piramide, la parte alta, che corrisponde al layer strategico/gestionale, è quella di pianificazione della continuità del business, mentre la base, che corrisponde al layer infrastrutturale (processi di recovery dei sistemi, strategie di data protection e backup, replica sincrona/asincrona…) è proprio quello su cui insiste il disaster recovery plan.
Un piano di disaster recovery (DRP) è un documento dettagliato che definisce le procedure e le istruzioni necessarie per aiutare un'organizzazione a ripristinare e recuperare le sue operazioni IT in caso di interruzione o disastro. L'obiettivo principale di un DRP è minimizzare il tempo di inattività e prevenire la perdita di dati.
I componenti principali di un DRP possono includere piani per il backup e il ripristino dei dati, la sostituzione di hardware e software, e la ripresa delle operazioni IT. Questo piano è particolarmente utile in situazioni in cui disastri come incendi, allagamenti, terremoti o attacchi informatici possono danneggiare l'infrastruttura IT di un'organizzazione.
Il piano trae spunto da altre attività specifiche, come la risk analysis e la business impact analysis, e definisce gli step che vanno posti in essere per minimizzare l’impatto dell’evento e soddisfare gli obiettivi principali del DRP, ovvero RTO (Recovery Time Objective) e RPO (Recovery Point Objective), che com’è noto vanno definiti in funzione del singolo processo e della sua rilevanza mission-critical. Anche i budget disponibili hanno un ruolo essenziale nella definizione di RTO e RPO, poiché garantire zero-downtime presuppone l’utilizzo di soluzioni evolute e, inevitabilmente, costose.
Quanto appena descritto identifica la natura fortemente operativa del disaster recovery plan, che però non si limita a definire la procedura tecnica da porre in essere (es, ripristino di un backup da infrastruttura cloud così da soddisfare l’obiettivo di RPO), ma anche le responsabilità dei singoli professionisti, l’eventuale comunicazione alle autorità e molto altro. Ovviamente, più l’azienda è strutturata e l’ambiente IT complesso, maggiore è l’onere di dettaglio che il piano deve in qualche modo soddisfare: in ambito enterprise, non è infrequente trovare DRP da centinaia di pagine.
Una corretta realizzazione del disaster recovery plan deriva in primis dalla quantità di informazioni a disposizione del team incaricato di formalizzarlo: processi, sistemi, rischi, impatti, strutture e potenziali eventi sono i pilastri su cui costruire un piano efficace, che deve essere al tempo stesso preciso, completo e strutturato. Nulla va lasciato al caso.
L’efficacia del disaster recovery plan dipende poi dalla capacità di prepararsi all’evento critico nonché dai test realizzati in ambienti sicuri e controllati. Ogni azienda può interpretare a suo modo l’estensione del disaster recovery plan, talvolta integrando elementi di analisi del rischio e degli impatti, ma non deve mai trascurare la sua natura di plan, di piano operativo indirizzato a tutelare i sistemi IT di fronte a un evento disruptive. Per questo, riteniamo che gli elementi che non possono mancare siano:
Per tutti i motivi citati, il Disaster Recovery Plan è quindi una parte, un elemento cardine di una strategia più ampia di continuità del business. Esistono aree del recovery plan che riguardano l’infrastruttura di rete, la continuità operativa dei server, il ripristino dei dati e dell’intero data center, magari sfruttando tutti i benefici del cloud.
Il cloud ha un impatto positivo e determinante su questo tema poiché consente alle aziende di implementare piani di disaster recovery a zero o near-zero downtime senza bisogno (come si faceva un tempo) di replicare fisicamente l’infrastruttura del data center proprietario in un secondo locale connesso stabilmente al primo ma debitamente distanziato dal punto di vista geografico: anche migliaia di chilometri, se le performance in termini di latenza non sono determinanti. Lo stesso risultato si ottiene delegando le attività di disaster recovery a un partner dotato di infrastruttura resiliente e distribuita. In tal caso, inoltre, anche le attività connesse al ripristino dei sistemi ricadono tra gli oneri del partner.
Per quanto l’approccio di cloud disaster recovery richieda una gestione corretta e continuativa, l’impatto su tempi, costi e affidabilità è notevole, e questo vale anche per il backup, altro pilastro della business resilience nonché unico mezzo efficace contro la cancellazione accidentale dei dati.