Logo ImpresaCity.it

Storage, cos’è e quale scegliere

Tutte le tecnologie e le architetture che compongono la grande famiglia dello storage. Come orientarsi per scegliere la soluzione che soddisfa al meglio le proprie esigenze

Il termine storage raccoglie tutte le tecnologie, i supporti, le infrastrutture e i software dedicati alla memorizzazione ‘non volatile’ di grandi quantità di dati, un universo in espansione che secondo l’analista Idc è destinato a raggiungere un volume pari a 163 zettabyte entro il 2025 (una quantità dieci volte superiore ai 16,1 zb di dati prodotti solo due anni fa).
Per le aziende si tratta spesso di informazioni vitali, da salvaguardare e gestire al meglio per garantire la continuità del proprio business e un efficace supporto alle decisioni. Ma non solo. Le recenti disposizioni europee in materia di trattamento dei dati sensibili obbligano, infatti, le imprese ad archiviare questo particolare tipo di informazioni secondo regole decisamente rigorose. Pena: multe molto salate.

Una molteplicità di esigenze d’archiviazione e gestione dei dati che oggi, nell’ampio ventaglio di soluzioni storage disponibili, trova ogni risposta possibile, permettendo di scegliere dai sistemi tradizionali alle soluzioni più scalabili e performanti, dalle infrastrutture convergenti e iperconvergenti ai sistemi storage in cloud, dai Nas con scalabilità orizzontale e verticale alle piattaforme di archiviazione a oggetti, fino ad arrivare ai sistemi più moderni, in grado di offrire funzionalità avanzate di Intelligenza Artificiale e Machine Learning per acquisire i dati e analizzarli. Un’offerta tanto vasta che può addirittura disorientare. Ecco allora una bussola per identificate le soluzioni più adatte alle proprie esigenze.
bussola

Storage primario e storage secondario

Di norma le organizzazioni utilizzano uno storage su più livelli per automatizzare l’archiviazione dei dati su supporti di tipologia diversa, scelti in funzione della loro capacità, del tipo di conformità richiesto e delle prestazioni da garantire a un'applicazione.

In base all’utilizzo dei dati e al tipo di supporto necessario, l'archiviazione dei dati viene così diretta al primary storage (memoria principale o primaria) o al secondary storage (memoria secondaria). Lo storage primario gestisce i carichi di lavoro delle applicazioni core di un’organizzazione e i dati vengono gestiti da memorie volatili, come la RAM, o altri componenti integrati, come la cache L1 del processore. Lo storage secondario memorizza, invece, i dati su flash, hard disk, nastri e altri dispositivi che richiedono operazioni di I/O. Questo significa che il secondary storage offre un accesso meno rapido ai dati rispetto allo storage primario, ma può archiviarne molti di più. Inoltre, lo storage secondario replica i dati inattivi, mantenendoli quindi disponibili nel caso siano nuovamente necessari.

Le tipologie di supporti per il data storage

Le principali tipologie di supporti di memorizzazione attualmente in uso includono i dischi rigidi (HDD), le memorie a stato solido, le memorie ottiche e quelle a nastro. La tecnologia alla base degli hard disk si basa sulla registrazione di una traccia magnetica su una superficie metallica rifinita a specchio. Ampiamente diffusi all’interno di pc, server e sistemi storage aziendali, questi supporti hanno però un limite legato alla loro durata e affidabilità. Per garantire una velocità di trasferimento dei dati sufficiente, il disco di un sistema magnetico deve girare infatti a velocità che possono arrivare addirittura a 15.000 rpm (giri al minuto), operazione che a lungo andare stressa notevolmente la meccanica del disco.
hard diskPer questo accanto ai tradizionali HDD si stanno sempre più diffondendo le unità Solid-State Drive (SSD), dischi a stato solido basati su circuiti integrati in cui array di transistor memorizzano bit e byte di dati sotto forma di cariche elettriche. Grazie all’uso di memorie Flash (una particolare tipologia di memoria a stato solido) queste unità garantiscono prestazioni di gran lunga superiori ai classici hard disk, il che rende sempre più spesso questi supporti la scelta di riferimento soprattutto quando la decisione d’acquisto è legata a parametri come la velocità di accesso e l’affidabilità. E ciò, nonostante il loro prezzo più elevato. Va, comunque, detto che anche il processo di scrittura di queste unità a lungo andare danneggia il materiale di cui sono costituite, il che ne limita il numero di scritture possibili.

Molto più popolare in ambito consumer è l'archiviazione ottica dei dati, utilizzata anche in sistemi di archiviazione dati ad alta capacità. A questo tipo di memorie si affiancano le schede flash, generalmente integrate nelle fotocamere digitali e nei dispositivi mobili. Questo tipo di memoria si trova, in particolare, su schede Secure Digital, schede CompactFlash, MultiMediaCard e chiavette Usb.

In epoca di tecnologia flash c’è, poi, ancora spazio per le memorie su nastro, unità particolarmente economiche utilizzate per archiviare a lungo termine dati, la cui consultazione è solamente occasionale oppure semplicemente obbligatoria per legge.


Archiviazione di file, a blocchi e a oggetti

Le forme più diffuse di storage dati sono l'archiviazione dei file, lo storage a blocchi e lo storage a oggetti. Ogni formato presenta naturalmente pro e contro. Nello storage a blocchi ogni volume di storage viene suddiviso in istanze individuali definite blocchi. Si tratta di un sistema di storage rapido e a bassa latenza, ideale per carichi di lavoro dalle elevate prestazioni e per dati che devono essere consultati e modificati di frequente. Lo storage di oggetti implica, invece, l'abbinamento di un'informazione a identificatori univoci, noti come metadati. Gli oggetti non sono compressi o crittografati, il che significa che è possibile accedervi velocemente e su vasta scala: per questo sono ideali per applicazioni di tipo cloud native. Economicamente vantaggioso, lo storage di file è, infine, la tecnologia tipicamente usata dai sistemi NAS per organizzare ed esporre i dati agli utenti. Caratterizzato da una struttura gerarchica, consente un’esplorazione estremamente facile dei dati in verticale, ma il processo allunga necessariamente i tempi di elaborazione.

Lo storage di rete tra DAS, NAS e SAN

In configurazione di rete i sistemi di storage da sempre più utilizzati sono tre: DAS, NAS e SAN. Il primo, acronimo di Direct Attached Storage, collega direttamente il sistema di archiviazione al server tramite una connessione Fibre Channel, SAS (Serial Attached SCSI) o SCSI. La condivisione dei dati avviene, quindi, tramite il server il che significa che qualsiasi suo guasto o qualunque problema agli apparati che gestiscono questa parte di rete si ripercuote sull’accessibilità dei dati da parte di tutti gli altri pc. Si tratta di un sistema economico e facile da implementare, ma soprattutto gestibile in modo estremamente semplice attraverso il sistema operativo del server a cui è collegata l’unità storage. Per queste sue caratteristiche rappresenta la soluzione ideale per tutti quegli ambienti con pochi server e senza particolari previsioni di crescita.

A differenza dei DAS, i NAS (Network Attacched Storage) sono server dedicati specificatamente allo storage e sono dotati di un sistema operativo e una scheda di rete per il collegamento alla LAN aziendale. Gestibili attraverso un semplice browser da qualsiasi computer presente nello stesso segmento di rete, questi sistemi sono del tutto indipendenti dal sistema operativo di rete utilizzato e possono essere, quindi, collegati a server misti, a condizione che usino tutti il protocollo TCP/IP. Economica e semplice da gestire, questa architettura è particolarmente adatta ad ambienti eterogenei, ma ha due svantaggi che possono diventare problemi seri in realtà dalle dimensioni medio-grandi e con un notevole traffico dati: innanzitutto aggiunge traffico alla LAN aziendale e, in secondo luogo, offre prestazioni limitate dall’uso del protocollo TCP/IP.

Per questo, quando il tema prestazioni diventa prioritario e il traffico dati è consistente, è consigliabile ricorrere alle SAN (Storage Area Network), reti locali dedicate allo storage che fanno transitare il traffico su una rete separata. Le reti SAN consistono normalmente di più elementi: sistemi di storage condivisi, una soluzione software per la configurazione dell’ambiente in cui operano e componenti di sicurezza a protezione del traffico dati. Le sue connessioni, basate su Fibre Channel, iScsi o SAS (Serial-attached Scsi), sono ad altissima velocità, mentre il trasferimento dati per grandi blocchi rende questa architettura particolarmente efficiente nelle situazioni in cui lavorano applicazioni con grandi quantità di dati da gestire. Scalabili e caratterizzate da un’altissima affidabilità, le SAN sono però strutturalmente complesse, per questo richiedono una gestione dedicata da parte di personale con competenze specifiche.
san

Software-Defined Storage, per chi cerca flessibilità

Rispetto alle architetture storage appena descritte il Software-Defined Storage rappresenta il passo evolutivo immediatamente successivo. Fondamentalmente si tratta di un'architettura che separa il software di storage dall’hardware sottostante, eliminando così la sua dipendenza da hardware proprietari. Questo disaccoppiamento consente di espandere la capacità dei sistemi in funzione delle esigenze aziendali, eseguendo un veloce upgrade o downgrade dell'hardware in base alle necessità. In parte software di virtualizzazione e in parte software di gestione dello storage, l’SDS offre il grande vantaggio della flessibilità e si dimostra particolarmente efficace con tutti i carichi di lavoro basati soprattutto su dati non strutturati. La sua capacità di aggiungere pochi nodi alla volta garantisce, tra l’altro, interessanti benefici economici, poiché permette di far crescere le infrastrutture in modo incrementale senza costringere a investimenti crescenti in storage array tradizionali.


Le tante facce del cloud storage

Lo storage su cloud permette l'archiviazione, la gestione e la distribuzione dei dati in modalità on demand a partire da volumi di storage virtualizzati, consolidati da diversi hardware fisici. Tutto questo spazio virtuale viene raggruppato nel cosiddetto Data Lake, al quale gli utenti accedono come se fosse un repository unico.

In ambito business le tipologie di cloud storage disponibili sono tre: storage su cloud pubblico, su cloud privato e su cloud ibrido. Lo storage su cloud pubblico è lo storage di dati tra pool di risorse virtuali creati a partire da hardware gestiti da terzi e di loro proprietà. Per le aziende non possedere e non poter gestire i sistemi su cui vengono archiviati i loro dati può rappresentare naturalmente un rischio: per questo sul mercato si sta diffondendo sempre più la logica del container. A differenza del cloud pubblico, quello privato si appoggia a pool di risorse virtuali, gestite e di proprietà delle aziende che le usano. Lo storage su cloud ibrido, infine, poggia su una combinazione di uno o più ambienti cloud pubblici e privati. La sua architettura separata, ma connessa, consente alle aziende di archiviare dati critici nel cloud privato e dati meno sensibili nel cloud pubblico, spostandoli da un ambiente all'altro in base alle loro esigenze.
cloud storage


Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con le notizie di ImpresaCity.it iscriviti alla nostra Newsletter gratuita.
Se vuoi ricevere le notifiche delle notizie più importanti della giornata iscriviti al canale Telegram di ImpresaCity al link: t.me/impresacity
Pubblicato il: 07/03/2019

Speciali

Download

Gestire la sicurezza alla convergenza tra IT e OT

Speciali

La sanità alla prova della trasformazione digitale