Data Center e dintorni: 10 concetti per chi non è sistemista.

Tempo di lettura: 13'

Quando si parla di Data Center entrano in gioco tutta una serie di sigle, termini e standard tecnici che non sempre sono immediati, soprattutto per chi non è del settore.

Oggi ci metteremo nei panni di tutte quelle piccole realtà che vogliono intraprendere un percorso serio di trasformazione digitale ma non hanno alle spalle un ufficio IT strutturato per affrontare con piena consapevolezza la complessità di tutto ciò che ruota attorno a questo ambito.

In questo articolo, quindi, proponiamo un glossario introduttivo ai principali termini che si trovano in approfondimenti, offerte o contratti relativi al mondo Data Center.

Indice

1. Colocation e cloud: i due modelli principali.

Due modelli, due modi diversi di usare un Data Center in termini sia di servizio sia di dinamiche infrastrutturali ed economiche. La distinzione, pertanto, non è solo tecnica.

Colocation

Detta anche Housing, è il modello per il quale il cliente acquista lo spazio fisico all’interno di un Data Center (come un rack o una porzione di rack), portando e gestendo il proprio hardware.

Di fatto, il provider mette a disposizione la facility, come alimentazione, raffreddamento, connettività e sicurezza fisica, ma il cliente mantiene la proprietà e il controllo diretto della propria infrastruttura.

Cloud

Premettendo che quando si parla di Cloud il discorso andrebbe approfondito in maniera molto più sfaccettata, qui ci limiteremo a darne una definizione per distinguerlo rispetto ai due servizi visti in precedenza.

Con modello Cloud, quindi, si descrive lo scenario per il quale le risorse (capacità di calcolo, memoria, spazio di archiviazione) sono virtualizzate e distribuite su una piattaforma condivisa, accessibili via internet. Il cliente non vede il singolo server, ma usa servizi “astratti” che possono crescere o ridursi in base alle esigenze. In questo caso i vantaggi sono massimi in termini di flessibilità, scalabilità, sicurezza ed efficienza economica.  

Dell’ambito Cloud fa parte l’hosting, modello per il quale il cliente non acquista lo spazio fisico del Data Center, ma utilizza servizi dedicati (principalmente servizi web) anche ad uso esclusivo. Da un lato il provider mette a disposizione il “ferro”, lo gestisce e si occupa di manutenzione e sostituzione. Dall’altro lato, il cliente lavora come se l’hardware fosse suo, ma senza l’onere della proprietà.

IaaS ibrida

2. Tier e Certificazioni internazionali

Una componente cruciale quando si affronta la scelta di un provider riguarda la classificazione architetturale e le certificazioni internazionali a supporto.

Il Tier

Il Tier è il sistema di classificazione sviluppato dall’Uptime Institute, ente di riferimento internazionale per la valutazione dei Data Center. Misura il livello di ridondanza, resilienza e capacità di un’infrastruttura di garantire continuità operativa.

I livelli sono quattro:

  • Tier I: infrastruttura di base, senza ridondanza significativa. Adatta a usi non critici.
  • Tier II: presenza di componenti ridondanti, ma una sola via di distribuzione. Maggiore tolleranza ai guasti rispetto al Tier I.
  • Tier III: ridondanza completa e percorsi di distribuzione multipli. Le manutenzioni ordinarie possono essere eseguite senza interrompere il servizio (livello nuovo Edge Data Center Planetel a Padova)
  • Tier IV: massimo livello di resilienza. La struttura tollera un guasto critico senza alcuna interruzione, grazie a sistemi completamente paralleli e indipendenti.

Quando si intavola una discussione commerciale o ci si imbatte in comunicazioni promozionali, è bene prestare attenzione alla differenza tra: “certificato Tier III” e “progettato secondo i criteri Tier III“. Non sono la stessa cosa: la prima formula presuppone un audit indipendente sul campo da parte dell’ente; la seconda è una dichiarazione del provider, senza verifica esterna.

Data Center Planetel

ANSI/TIA e ISO

Accanto al Tier, esistono altri standard internazionali che certificano la qualità, l’efficienza e la sicurezza di un Data Center:

  • ANSI/TIA-942: è lo standard tecnico statunitense che definisce specifiche di progettazione su impianti elettrici, raffreddamento, cablaggi e sicurezza fisica. Prevede quattro livelli (Rated 1-4), concettualmente paralleli ai Tier dell’Uptime Institute.
  • ISO/IEC 22237: è lo standard internazionale equivalente all’ANSI/TIA-942, riconosciuto a livello europeo. Anch’esso ha 4 livelli, definiti classi, pressoché complementare ai Tier.
  • ISO/IEC 27001: certifica la gestione della sicurezza delle informazioni, ovvero l’aspetto organizzativo e procedurale della tutela dei dati.
  • ISO/IEC 27017 e 27018: estendono la 27001 al contesto cloud, con focus rispettivamente sulle responsabilità del provider e sulla tutela dei dati personali.
  • ISO 22301: certifica i sistemi di gestione della continuità operativa (business continuity).

Come Planetel, abbiamo ottenuto tutte le precedenti certificazioni. In particolare, per quanto concerne ANSI/TIA-942 e ISO/IEC 22237, il nostro nuovo Edge Data Center ha ottenuto un rating di 3 su 4, confermando l’eccellenza della struttura.

Le differenze

Malgrado possano essere considerate simili a livello di significato, è opportuno chiarire la differenza concettuale tra i due sistemi. Il Tier guarda alla resilienza fisica della struttura. Le ISO certificano i processi e le procedure di gestione. L’ANSI/TIA scende nel dettaglio tecnico-progettuale. Non sono alternative ma complementari. Un Data Center realmente affidabile combina tutte le dimensioni.

3. Uptime e disponibilità: lo standard dei “nove”

L’uptime esprime la percentuale in cui un servizio risulta disponibile su base annuale o mensile. In altre parole, il provider ti sta dicendo per quanto tempo è tollerata, da contratto, un’eventuale inattività e inaccessibilità alle risorse (downtime).

Le soglie di uptime tipiche nei contratti seguono lo “standard dei nove”, andando dal 99% al 99,999%. In pratica, più nove ci sono dopo la virgola meglio è in termini di disponibilità del servizio.

In linea di massima queste soglie sono associate al Tier del Data Center, sebbene vada specificato che tale legame non è vincolante: la percentuale definisce l’impegno commerciale del provider e il risarcimento economico, mentre il Tier definisce l’architettura. Detto ciò, riportiamo di seguito una tabella comparativa per fissare questo tema nel dettaglio[1]:

TierDisponibilitàDowntime annuale massimo consentito
I99.671%~ 28 ore
II99.741%~ 22 ore
III99.982%~ 1 ora e mezza
IV99.995%~ 26 minuti

È evidente il peso che questo divario assume a livello di ripercussioni operative, economiche e reputazionali per una qualsiasi attività commerciale.

4. RPO e RTO: cosa si perde e per quanto si resta fermi

Si tratta di due parametri fondamentali all’interno delle dinamiche dei servizi in Data Center ed è fondamentale avere contezza delle differenze.

RPO – Recovery Point Objective

L’RPO è la quantità massima di dati che l’azienda può permettersi di perdere in caso di incidente, espressa in tempo. Si tratta di un valore che determina la granularità dei backup, ossia l’intervallo temporale che trascorre tra un backup e il successivo.

Ad esempio, un RPO di 24 ore significa backup giornaliero. Vale a dire che un guasto alle 23:00 comporterebbe la perdita di tutto ciò che è stato generato durante la giornata. Al contrario, con un RPO di 1 ora, verrebbero eliminati, nella peggiore delle ipotesi, i dati generati in quell’ultima ora.

È lampante che la decisione attorno al valore di RPO non è solo un dettaglio tecnico, bensì una scelta di rischio aziendale.

RTO – Recovery Time Objective

L’RTO, invece, è il tempo massimo necessario per ripristinare i sistemi dopo un’interruzione. Non dice quanti dati si perdono, ma quanto a lungo si rimane fermi. Rappresenta l’obiettivo entro cui i sistemi e i dati devono essere ripristinati per garantire la continuità operativa senza subire danni inaccettabili. Chiaramente un RTO di 15 minuti ha implicazioni diverse rispetto a un RTO di 12 ore.

I sistemi più critici richiedono una finestra prossima allo zero, mentre per applicazioni secondarie si possono tollerare tempi più lunghi. Anche in questo caso è una questione di strategia aziendale, legata alla valutazione dell’effettiva capacità di tollerare fermi operativi.

Due valori che dialogano

Nella progettazione di un piano di backup o disaster recovery, RPO e RTO devono essere affiancati, così da rendere visibile l’impatto reale di un incidente sul business. Il problema più comune è che molti contratti riportano questi valori senza che vengano mai testati sul campo, e senza una simulazione reale sono numeri senza garanzia.

Facciamo anche qui un esempio: avere un RPO di 4 ore e un RTO di 8 ore significa che si perdono al massimo 4 ore di dati, ma si può restare fermi fino a 8 ore. Naturalmente, insieme al proprio ufficio IT o partner di riferimento, vanno valutate le ripercussioni che un modello di questo genere può avere sulla propria azienda.

IaaS

5. Peering e transito IP: connettività non è solo velocità

Per dirla in modo semplice, questi concetti spiegano come un Data Center si connette al resto di internet e perché incide sulle prestazioni che si ottengono. Spesso vengono confusi, ma sono due modelli di interconnessione differenti.

Transito IP

Noto anche come IP Transit, è il servizio a pagamento per il quale il Data Center si affida a un provider di routing per raggiungere qualsiasi indirizzo Internet. È il “tubo” di connettività ad altissima velocità e capacità che collega l’infrastruttura fisica alla rete mondiale.

In pratica, il provider acquista la connettività da grandi operatori di telecomunicazioni o fornitori di rete e, tramite uno specifico protocollo di routing fornisce le “rotte” necessarie affinché i dati inviati dai server raggiungano qualsiasi indirizzo IP nel mondo. In questo modo, i dati escono dal Data Center e arrivano agli utenti finali o ad altri servizi.

È il modello standard presente in qualsiasi infrastruttura connessa, con vantaggi riconosciuti in termini di accesso universale, scalabilità, ridondanza e stabilità.

Peering

È un accordo di interconnessione diretta tra due o più reti che si scambiano traffico reciprocamente. Questa modalità consente ai dati di viaggiare in modo diretto tra i due operatori senza pagare costi aggiuntivi, migliorando le prestazioni della rete e riducendo la latenza.

Può succedere che le due reti colleghino i propri apparati direttamente (peering privato) o si incontrino in un punto neutro (peering pubblico) chiamato Internet Exchange Point (IXP).

In Italia i principali IXP sono il MIX di Milano e il NaMeX di Roma.

Il vantaggio del peering è che i dati dei rispettivi utenti arrivano a destinazione più velocemente perché non devono passare attraverso operatori intermediari.

6. NOC e SOC: due ruoli che non fanno la stessa cosa

A livello operativo e strategico, NOC e SOC operano su livelli distinti. Il primo lavora sulla continuità del servizio, il secondo sulla sicurezza dei dati. In un sistema ottimizzato, queste due componenti dovrebbero dialogare e ottimizzarsi tra loro, rafforzandosi a vicenda.

Questa è proprio la direzione che abbiamo intrapreso noi di Planetel, dove il presidio della sicurezza è gestito dalla nostra divisione cybersecurity Orazero, che opera in stretto coordinamento con il NOC interno, offrendo così un servizio efficace e all’avanguardia.

NOC

Il Network Operations Center (NOC) è il presidio tecnico che monitora h24 l’infrastruttura di rete e i sistemi del Data Center: stato dei server, disponibilità della rete, parametri elettrici e termici. Quando qualcosa si guasta o degrada, il NOC interviene per ripristinare l’operatività. L’obiettivo del NOC, in una parola, è preservare l’uptime.

Assistenza Planetel

SOC

Il Security Operations Center (SOC) è, invece, il presidio dedicato alla sicurezza informatica. Gli analisti del SOC monitorano log, traffico di rete e comportamenti anomali per rilevare tentativi di attacco, intrusioni o eventi sospetti. Quando si verifica un incidente di sicurezza, il SOC lo gestisce attraverso attività di contenimento, analisi forense, ripristino. L’obiettivo del SOC è proteggere integrità e riservatezza dei dati.

SOC Cybersecurity

7. Ridondanza: N, N+1, 2N, 2N+1

La ridondanza descrive quante copie di ogni componente critico (alimentatori, UPS, gruppi elettrogeni, sistemi di raffreddamento) sono installate rispetto al minimo necessario per far funzionare l’infrastruttura.

Anche in questo caso è importante far attenzione alle sigle, che ruotano attorno alla lettera N. Essa rappresenta il numero esatto di componenti necessari per far funzionare il sistema a pieno carico.

Sigla
NNessuna ridondanza. Se un componente critico si guasta, il servizio si interrompe.
N + 11 modulo di riserva oltre al necessario. Copre un singolo guasto o una manutenzione alla volta.
2NDuplicazione totale su percorsi separati. Se un intero sistema dell’impianto collassa, l’altro regge da solo al 100% del carico.
2N + 12 sistemi completi con un ulteriore elemento di riserva su ciascuno. È lo standard per infrastrutture che non possono permettersi interruzioni in nessun caso.

È ovvio che ridondanza e costi sono proporzionali, sia per il provider che mette a disposizione il Data Center sia per il cliente che firma il contratto.

Le nostre strutture sono interconnesse ad anello e ridondate. Ad esempio, il nuovo Edge Data Center di Padova disporrà di un doppio anello ottico con capacità di 2×400 Gb/s.

8. PUE: l’indicatore dell’efficienza energetica

Il Power Usage Effectiveness (PUE) misura l’efficienza di un Data Center come rapporto tra l’energia totale consumata dalla struttura e quella effettivamente usata dalle apparecchiature IT.

La perfezione è rappresentata da un PUE teorico di 1,0, in virtù del quale tutta l’energia verrebbe utilizzata dai sistemi IT. Fissiamo le differenze in una tabella:

PUEValutazioneSignificato
1,0 – 1,3EccellenteSistemi di raffreddamento a liquido o intelligenza artificiale per ottimizzare i consumi.
1,5 – 1,6MedioLo standard medio attuale per la maggior parte dei Data Center.
>2ScarsoLa maggior parte dell’energia viene sprecata per dissipare calore e alimentare sistemi di supporto.

Per quanto riguarda Planetel, ad esempio, le vasche di raffreddamento che andremo ad inserire nei nostri Data Center avranno valori di PUE vicino alla perfezione teorica, tra 1,03 e 1,05.

Perché il PUE è importante per un’azienda che sta decidendo a quale provider affidarsi? Le motivazioni sono due: entra direttamente in bolletta e, a seguito degli obblighi di rendicontazione CSRD, incide sul bilancio di sostenibilità aziendale.

9. Latenza e jitter come misura della qualità della rete.

Sono due parametri che molte SLA di connettività non vincolano ma che, in alcuni casi, possono risultare molto più cruciali di altri elementi.

Latenza

È il tempo impiegato dai datiper viaggiare dal server al destinatario dell’informazione e ritornare, misurato in millisecondi. Su questo valore influiscono fattori come la distanza fisica e il numero di passaggi di routing tra gli operatori.

Una latenza bassa è cruciale. Se la latenza è alta, oltre i 100-150 ms, le applicazioni in tempo reale come VoIP, videoconferenza o accessi a gestionali remoti possono risultare lente.

Jitter

È un indicatore che restituisce la variabilità della latenza nel tempo. Se un pacchetto di dati impiega 10 ms, il successivo 40 ms e il terzo 15 ms, si è in presenza di alto jitter e la connessione risulta instabile per l’utente anche quando la latenza rimane contenuta.

In pratica la latenza è un problema di ritardo fisso, lo Jitter di irregolarità. L’obiettivo, per un Data Center efficiente, è quello di mantenere la latenza più bassa possibile e il jitter vicino allo zero, così da assicurare un flusso di dati costante e, di conseguenza, l’affidabilità delle architetture cloud e IT.

10. L’importanza dello SLA (Service Level Agreement)

Il Service Level Agreement è l’accordo contrattuale che stabilisce il livello di qualità del servizio garantito dal provider dal punto di vista di disponibilità, tempi di intervento in caso di disservizio, clausole ed eventuali penali.

Una SLA scritta male o approssimativa è spesso peggio di nessuna SLA, perché potrebbe dar seguito a incomprensioni, incongruenze o aspettative che poi si traducono in conseguenze fastidiose per entrambi gli attori.

A livello macro, i tre aspetti che meritano un’attenzione particolare quando ci si approccia a uno SLA sono:

  • Verificare se la disponibilità in termini di uptime è calcolata su base mensile o annuale;
  • Controllare modalità e dinamicherelative al mancato rispetto delle soglie concordate;
  • Appurare come sono trattate le manutenzioni programmate nell’ottica di downtime, frequenza e preavviso.

FAQ — Glossario Data Center: le domande più frequenti

In questa sezione rispondiamo ad alcune delle domande che riceviamo più frequentemente quando si parla di Data Center.

Qual è la differenza tra colocation, hosting e cloud?

La colocation prevede l’affitto di spazio fisico in un Data Center, dove il cliente porta e gestisce il proprio hardware. Nel Cloud, invece, le risorse sono virtualizzate, condivise e pagate a consumo. L’hosting, infine, è una soluzione cloud per la quale il cliente utilizza hardware del provider, dedicato in uso esclusivo, senza acquistarlo. La scelta tra queste formule dipende dal grado di controllo desiderato, dalla disponibilità di competenze interne e dalla preferenza tra investimento una tantum e spesa corrente.

Cosa significa avere un SLA al 99,95%?

Uno SLA al 99,95%, come quello di Planetel, comporta che il provider garantisce contrattualmente la disponibilità del servizio per il 99,95% del tempo su base annuale, con un downtime massimo tollerato di circa 4 ore e 20 minuti in un anno. È un valore solido per la stra grande maggioranza dei servizi business.

Cos’è il Tier di un Data Center?

Il Tier misura il livello di ridondanza e resilienza di un Data Center, da Tier I (base) a Tier IV (massima resilienza). È il riferimento internazionale più conosciuto per classificare una struttura e valutarne la qualità infrastrutturale.

Cosa sono RPO e RTO e come si scelgono?

RPO (Recovery Point Objective) indica la massima perdita di dati accettabile in caso di incidente, espressa in tempo. RTO (Recovery Time Objective) indica il tempo massimo per ripristinare i sistemi dopo un’interruzione. La scelta dei due valori dipende dalla criticità delle applicazioni e dalla capacità dell’azienda di tollerare fermi e perdite di dati. Vanno definiti insieme al partner IT e ai responsabili aziendali, sulla base dell’impatto reale che un incidente avrebbe sul business.

NOC e SOC sono la stessa cosa?

No. Il NOC (Network Operations Center) monitora la disponibilità dell’infrastruttura di rete e dei sistemi, con l’obiettivo di preservare l’uptime del servizio. Il SOC (Security Operations Center) si occupa di sicurezza informatica e protegge l’integrità dei dati. Tuttavia, è bene che siano strettamente correlati e integrati tra loro.

Perché affidarsi ai Data Center Planetel

Conosciamo i termini di questo glossario perché li applichiamo ogni giorno con serietà e competenza, in base alle effettive necessità del cliente.

Alle spalle abbiamo risorse tecniche e competenze professionali importanti, grazie a un’esperienza TLC di oltre 40 anni, agli esperti di Planetel.Cloud e agli specialisti di Orazero in ambito Cybersecurity.

Se stai valutando un cambio di provider o vuoi capire meglio cosa prevede il tuo contratto attuale, siamo disponibili per un confronto diretto. Puoi contattarci all’indirizzo [email protected] oppure al numero 035 204070.

Cybersecurity

[1] Uptime Institute