Sapevi che circa il 90% di tutti i dati disponibili oggi nel mondo è stato generato negli ultimi anni? Grazie alle nuove tecnologie di informazione e comunicazione, il volume di dati in tutto il mondo è cresciuto incredibilmente e offre possibilità precedentemente sconosciute. Il termine BigData sta per questo volume di dati strutturati e non strutturati, che non possono essere elaborati con software o hardware convenzionali a causa delle loro dimensioni.
Questi volumi di dati vengono creati, tra le altre cose, con ciascuno dei nostri clic su Internet. Questo può essere, ad esempio, un acquisto su Amazon, una chiave di ricerca su Google, le attività compiute sui social network come Instagram o Facebook, ecc.
Tuttavia, grandi quantità di dati da sole non sono sufficienti a produrre Big Data. Solo l’analisi e l’elaborazione di questi volumi di dati, ad es. da un’azienda, produce i Big Data. Nel 2001, l’analista Doug Lane ha creato una definizione di Big Data con il suo modello a 3 V ancora oggi riconosciuto. Secondo Lane, i Big Data hanno le seguenti tre caratteristiche:
Volume: Le aziende raccolgono grandi volumi di dati da varie fonti. Questi includono dispositivi intelligenti (IoT) come telefoni cellulari, video, social media, ecc. In passato non sarebbe stato possibile archiviare questo grande volumi di dati; oggi esistono piattaforme di archiviazione per questo scopo.
Velocità: Le aziende sono attualmente invase da flussi di dati a velocità senza precedenti che devono essere elaborate rapidamente.
Varietà: I dati raccolti sono eterogenei e hanno una grande varietà di formati: i dati numerici, disponibili in forma strutturata e archiviati in normali banche dati, possono far parte di Big Data, nonché documenti di testo non strutturati, creati da transazioni finanziarie o e-mail.
Definizione
Big Data
… significa una grande quantità di dati disponibili che vengono analizzati ed elaborati per uno scopo specifico. Secondo Doug Lane, i Big Data sono caratterizzati da volume, velocità e varietà.
Big Data vs. Small Data
Diversamente dai Big Data, Small Data si riferisce ai dati in un volume e in un formato accessibili all’uomo. I seguenti punti mostrano come i Big Data possono essere distinti dai Small Data:
Obiettivi: gli Small Data vengono utilizzati per un obiettivo definito, l’uso dei Big Data si sviluppa spesso in modo imprevisto.
Luogo: I piccoli dati vengono generalmente archiviati in un unico posto, di solito in un file sul PC, mentre i big data vengono generalmente distribuiti su numerosi file su server diversi situati in paesi diversi.
Struttura dei dati: I piccoli dati sono strutturati in linea retta, mentre i big data possono essere non strutturati e possono avere molti formati di file da campi diversi.
Preparazione dei dati: di solito solo un utente finale è coinvolto nella preparazione di piccoli dati. Nel caso dei Big Data, tuttavia, spesso accade che un gruppo di persone prepari i dati, un altro gruppo analizzi i dati e infine un terzo gruppo utilizzi i dati. Ognuno di questi gruppi può avere obiettivi diversi.
Durata: Gli Small data vengono generalmente conservati per un certo periodo di tempo dopo il completamento di un progetto. Nel caso dei Big Data, tuttavia, i dati rimangono memorizzati per un periodo di tempo illimitato.
Origine: gli Small Data vengono memorizzati in breve tempo e in unità di misura specifiche. I Big Data, d’altra parte, provengono da diversi luoghi, paesi, aziende, organizzazioni, ecc.
Riproducibilità: Small Data possono generalmente essere completamente riprodotti. I Big Data, al contrario, provengono da molte fonti diverse e sono disponibili in talmente tante forme che la loro riproduzione è impossibile
Qualità: i significati dei dati in un set di small data non sono ambigui, pertanto questi dati possono essere descritti. I Big Data, al contrario, sono molto più complessi e possono anche contenere informazioni non identificabili che non hanno un significato specifico. Ciò può ridurre la qualità delle informazioni
Analisi: un singolo processo è in genere sufficiente per l’analisi di piccoli dati, poiché i dati vengono analizzati da un solo file di computer. Nel caso dei Big Data, i dati devono essere estratti, controllati, ridotti, ecc. in un processo che richiede tempo.
Come puoi vedere dalla distinzione tra Big Data e Small Data, i Big Data sono letteralmente spesso difficili da comprendere.
Sapevi che circa il 90% di tutti i dati disponibili oggi nel mondo è stato generato negli ultimi anni? Grazie alle nuove tecnologie di informazione e comunicazione, il volume di dati in tutto il mondo è cresciuto incredibilmente e offre possibilità precedentemente sconosciute. Il termine Big Data sta per questo volume di dati strutturati e non strutturati, che non possono essere elaborati con software o hardware convenzionali a causa delle loro dimensioni.
Questi volumi di dati vengono creati, tra le altre cose, con ciascuno dei nostri clic su Internet. Questo può essere, ad esempio, un acquisto su Amazon, una chiave di ricerca su Google, le attività compiute sui social network come Instagram o Facebook, ecc.
Tuttavia, grandi quantità di dati da sole non sono sufficienti a produrre Big Data. Solo l’analisi e l’elaborazione di questi volumi di dati, ad es. da un’azienda, produce i Big Data. Nel 2001, l’analista Doug Lane ha creato una definizione di Big Data con il suo modello a 3 V ancora oggi riconosciuto. Secondo Lane, i Big Data hanno le seguenti tre caratteristiche:
Definizione
Big Data
… significa una grande quantità di dati disponibili che vengono analizzati ed elaborati per uno scopo specifico. Secondo Doug Lane, i Big Data sono caratterizzati da volume, velocità e varietà.
Big Data vs. Small Data
Diversamente dai Big Data, Small Data si riferisce ai dati in un volume e in un formato accessibili all’uomo. I seguenti punti mostrano come i Big Data possono essere distinti dai Small Data:
Come puoi vedere dalla distinzione tra Big Data e Small Data, i Big Data sono letteralmente spesso difficili da comprendere.