Big Data

La parola della settimana

Cosa sono i Big Data?

Big Data è un espressione che indica le nuove tecniche di raccolta e analisi di quegli insiemi di dati così grandi o complessi da rendere impossibile l’utilizzo di database o modalità di visualizzazioni tradizionali. Negli ultimi anni la quantità di informazioni registrate su supporto digitale sta aumentando vertiginosamente e si stanno sviluppando delle soluzioni che permettano di gestire questa grande mole di dati. I Big Data sono dunque un modo intelligente di operare con quantità e tipologie di informazioni mai avute a disposizione fino a ora, cercando di far seguire all’aspetto quantitativo dei dati uno scatto in avanti nella qualità delle informazioni. I sistemi di analisi e visualizzazione dei Big Data, uniti a soluzioni cloud di storage dei dati, rappresentano un’opportunità per aziende e organizzazioni di ricavare preziosi insight e previsioni dai dati che hanno accumulato, e accumuleranno, nel corso del tempo.

Si possono pensare i Big Data?

1200 exabyte di dati è il totale della quantità di informazioni disponibili sul pianeta oggi. Sono l’equivalente di 20 colonne di dvd dalla terra alla luna. Il cervello umano ospita circa 1024 gigabyte di informazioni. Un exabyte equivale a 1 miliardo di gigabyte, circa 1 milione di cervelli dunque. Ogni tre giorni vengono prodotti circa 5 exabyte di dati. E’ l’equivalente della quantità di informazioni generate dall’umanità intera fino al 2003.

Le 5 V dei Big Data

Volume. Si stima che entro il 2020 verranno creati 43 zettabyte di dati (ovvero 43 mila miliardi di gigabyte). Già oggi molte aziende possiedono centinaia di terabyte di informazioni e ciò impone l’utilizzo di sistemi per lo storage distribuito.

Varietà. Tweet, video, immagini, transazioni finanziarie, acquisti, audio, testi, esami clinici. E per tutti questi i relativi metadati. La molteplicità di fonti rende necessari sistemi in grado di operare con diversi regimi di dati, che possono essere strutturati o meno.

Velocità. Non conta solo la dimensione dei dati, ma anche la possibilità di analizzarli, estraendo le informazioni significative, in tempi brevi, se non addirittura in real-time.

Veridicità. I dati devono essere affidabili. Anche se una certa soglia di inesattezza è inevitabile, i Big Data devono avere una fonte in grado di poter essere controllata. Da ciò dipende la possibilità di ottenere delle previsioni veritiere.

Valore. Poiché i sistemi necessari sono costosi, il vero obiettivo deve essere quello di poter estrarre valore, anche in senso economico, da questa grande quantità di dati. Ogni informazione ha infatti un valore di mercato che viene valutato in base alla sua utilità ma anche al costo dei sistemi che sono in grado di fornirla. Sicuramente i dati sono una risorsa, per alcuni sono il petrolio del 21esimo secolo.