Sempre più spesso le aziende chiedono una soluzione efficace per gestire quantità di dati non strutturati, cioè non organizzati secondo schemi e tabelle.
Questo aspetto riguarda i dati che vengono utilizzati attivamente, ma di conseguenza anche il salvataggio e l’archiviazione degli stessi dati diventa a sua volta un problema da gestire.
Facciamo un esempio e consideriamo 1TB di dati non strutturati. Per la salvaguardia di questi dati utilizziamo un adeguato software che ne ottimizzi i processi e applichiamo una politica di salvataggio che ne consenta il recupero degli ultimi 30 giorni, l’archiviazione degli ultimi 6 mesi e perché no, degli ultimi 3 anni. É facile intuire che la quantità di questi dati importanti, per non dire “vitali” nel momento del bisogno, sia superiore alla quantità di dati originali: basandoci sull’esperienza dai nostri clienti questo valore è di circa 6 volte maggiore, quindi nel nostro esempio dovremmo dotarci di un sistema con una capacità di almeno 6 TB.
HPE StoreOnce è la soluzione che abbiamo implementato con soddisfazione in più di un contesto per garantire la protezione di una quantità crescente di dati contenendo i costi.
A partire dalla soluzione “software” HPE StoreOnce VSA, indipendente dall’hardware e utilizzabile in diversi ambienti virtualizzati come VMware vSphere e Microsoft Hyper-V, fino alla soluzione per grandi Datacenter HPE StoreOnce 6600, si tratta di una architettura in grado di soddisfare praticamente qualsiasi esigenza: una delle sue caratteristiche distintive infatti è la scalabilità, che consente di investire di pari passo con la crescita della quantità dei dati.
Opportunità non da poco è una licenza “gratuita” pari a 1TB in modalità Virtual Appliance: in questo modo si possono testare TUTTE le funzionalità, che sono comuni dal prodotto di fascia entry fino al prodotto top di gamma, facilitando così l’acquisizione di know-how per chi deve gestire questi sistemi.
Qualche numero reale può essere di aiuto per comprendere la bontà della soluzione: la tabella che segue raccoglie i dati di 10 installazioni campione presso nostri clienti:
Si può notare che metà delle installazioni sono basate su Virtual Appliance: i clienti hanno riutilizzato hardware già in loro possesso al costo della sola licenza per 4TB o 10TB e consentono l’archiviazione di dati con un fattore di deduplicazione superiore al 4x (nel peggiore dei casi).
Il rapporto di deduplicazione è un indice difficilmente predicibile: cosa lo determina? Tra i fattori che lo influenzano c’è l’uniformità dei dati di origine: se ad esempio devo salvare dati provenienti da Virtual Machine che hanno lo stesso sistema operativo avrò un buon fattore di deduplicazione. Al contrario se i dati da salvare sono costituiti da più sistemi diversi tra di loro questo rapporto tenderà a diminuire.
Il rapporto di deduplicazione è poi un parametro dinamico dato dalla quantità di blocchi di dati uguali scritti effettivamente rispetto ai dati originali: inizialmente sarà “basso” perché il numero di blocchi uguali sarà statisticamente “basso”. Le successive operazioni di scrittura aumenteranno questa probabilità e di conseguenza anche l’indice di deduplicazione aumenterà, fino a stabilizzarsi su un valore che varierà di poco in funzione anche delle operazioni di cancellazione dei dati obsoleti.
Perché una soluzione sia buona è quanto mai necessario che permetta una chiara e attenta a analisi dei dati.
HPE StoreOnce è una soluzione completa anche dal punto di vista del reporting: sono integrate le principali funzionalità statistiche che consentono di identificare lo stato del sistema, l’efficienza dell’algoritmo di deduplicazione, fino a prevedere i requisiti di spazio necessari al crescere dei dati.
Le schermate che seguono mostrano un caso reale in produzione da più di un anno:
I dati depositati su questa appliance sono il risultato di processi di backup di VM in ambiente VMware tramite Veeam e garantiscono al cliente la possibilità di recuperare dati fino a 30 gg indietro nel tempo. Lo spazio effettivamente occupato è di poco superiore a 7TB, mentre i dati salvati avrebbero richiesto circa 40TB.
Questa immagine riassume bene l’efficienza della soluzione: a fronte delle normali oscillazioni dei dati salvati dovuti a nuove operazioni di scrittura a cui seguono operazioni di cancellazione dei dati obsoleti, che in questo esempio reale corrispondono a circa 6TB, lo spazio realmente occupato rimane pressoché invariato.
Sempre più aziende affrontano il tema della protezione dei dati dovendo fare i conti con quantità crescenti di dati che non erano state previste. Spesso a questa contingenza si aggiunge la necessità di una soluzione che non incida troppo negativamente su un budget già destinato per altri progetti strategici.
L’adozione di una tecnologia (deduplicazione) che sia in grado di contenere da subito i costi di una crescita difficilmente prevedibile dei dati non strutturati è una strategia che porta con se anche il beneficio immediato di poter aumentare la finestra dei dati recuperabili a parità di spazio occupato.
Per molte situazioni poter contare su una architettura che sia integrabile con l’ambiente esistente in modo semplice, efficiente e non invasivo, come una qualsiasi Share di rete oppure una normalissima Tape Library è un fattore decisivo per determinarne l’adozione. Ugualmente se la stessa architettura può dialogare nativamente con lo Storage primario (3PAR StoreServ) realizzando un’architettura di protezione del dato End-to-end, questa diventa la soluzione ottimale.
Avere la possibilità di realizzare processi di salvataggio che siano distribuiti su più siti, compresi Datacenter remoti e spazio in “cloud”, piuttosto che organizzare la centralizzazione di processi di salvaguardia dei dati periferici, costituiscono altri requisiti che devono far parte di una moderna soluzione di protezione dei dati.
L’architettura scalabile HPE StoreOnce possiede tutte queste caratteristiche: consente di proteggere quantità crescenti di dati a costi contenuti e di investire di pari passo con il variare delle esigenze. Si può iniziare con la virtual appliance riutilizzando hardware esistente e quindi implementare successivamente appliance dedicate con capacità e prestazioni via via crescenti.
Si può eseguire la deduplica ovunque: all’origine dell’applicazione, nel server di backup, sul dispositivo di destinazione, senza limitazioni.
Si configura in modo semplice e si adatta ai processi esistenti: può essere utilizzata come spazio disco condiviso in rete e sostituire l’eventuale NAS utilizzato fino a quel momento. Può sostituire una vecchia una Tape Library collegata in FC o iSCSI, consentendo la dismissione dei supporti rimuovibili e riducendo i tempi in salvataggio, e soprattutto in caso sia necessario recuperare dei dati. Si integra alla perfezione se lo storage primario è 3PAR StoreServ: in questo scenario dà il meglio di sé automatizzando il passaggio diretto del dato salvato tramite snapshot. Anche a livello applicativo si può sfruttare un’ampia integrazione con soluzioni di protezione dati di terze parti come Veeam, piuttosto che utilizzando plug-in che abilitano salvataggi ottimizzati per SAP, Oracle RMAN e MS SQL.
E’ possibile realizzare politiche di salvataggio che coinvolgono più appliance fisiche o virtuali, all’interno della stessa rete aziendale o dislocate su rete geografica, pianificando più copie dello stesso dato in siti diversi o concentrando dati provenienti da più fonti in un singolo contenitore. In precedenza scenari del genere non erano applicabili per mancanza di funzionalità avanzate, capacità degli storage e tempo necessario per portare le procedure a corretta conclusione.
Per tutti questi motivi NETMIND propone con sempre più frequenza HPE StoreOnce, contestualizzando di volta in volta la corretta soluzione con la necessità del cliente.
Articolo curato da Giovanni Golinelli, Storage & Data Protection Specialist @ NETMIND