Nei capitoli precedenti hai assistito alla complessità dell’analisi e dell’utilizzo dei Big Data. Almeno altrettanto complesse sono le sfide e i rischi associati a grandi quantità di dati. Probabilmente la più grande sfida per le aziende in relazione ai Big Data è la protezione dei dati:
Sebbene le aziende abbiano prestato maggiore attenzione alla protezione dei dati negli ultimi anni, ci sono ancora problemi. Ad esempio, i dati personali degli utenti di Internet possono essere utilizzati senza il loro consenso e le persone interessate possono essere identificate, controllate e nel peggiore dei casi ricattate.
Definizione
Dati personali
fa riferimento a dati che si riferiscono a una persona e consente di trarre conclusioni sulla sua personalità. Ciò include, ad esempio, il numero di targa di Mario Bianchi, la data di nascita del tuo vicino o il saldo del conto di Bill Gates.
Un esempio di violazione della protezione dei dati in relazione ai Big Data è il caso del portale di lancio di Ashley Madison, che è già stato menzionato come Esempio nel capitolo 2. In questo caso, i dati personali sono diventati pubblici e sono stati utilizzati per ricattare i proprietari di i dati.
Le normative e le leggi sulla protezione dei dati aiutano a proteggere i consumatori dagli abusi. La base della legge generale sulla protezione dei dati nell’Unione europea e in Austria è il regolamento generale sulla protezione dei dati, entrato in vigore il 25 maggio 2018.
Excursus
Il Regolamento Generale di Protezione dei Dati – GDPR
Il regolamento generale sulla protezione dei dati, o GDPR in breve, è chiamato nella sua interezza “Regolamento (UE) 2016/679 del Parlamento europeo e del Consiglio, del 27 aprile 2016, relativo alla protezione delle persone fisiche con riguardo al trattamento dei dati personali, nonché alla libera circolazione di tali dati e che abroga la direttiva 95/46/CE”.
Questo regolamento consente ai cittadini dell’UE di controllare meglio la raccolta e l’uso dei propri dati personali. Ciò dovrebbe rafforzare la fiducia dei consumatori nelle singole società. I diritti esistenti dei cittadini dell’UE sono consolidati nel GDPR e vengono anche stabiliti nuovi diritti. I diritti stabiliti nel GDPR includono:
accesso semplificato ai dati personali – ciò include la fornitura di informazioni complete, chiare e comprensibili sul trattamento dei dati
un nuovo diritto alla trasferibilità dei dati: i dati personali saranno trasferiti in modo semplificato
un diritto più chiaro alla cancellazione (“diritto all’oblio”): i dati vengono cancellati se un cittadino non acconsente al trattamento dei propri dati e non vi sono motivi legittimi per conservarli
un diritto ad essere informato sui dati personali compromessi: le aziende e le organizzazioni informano immediatamente le persone interessate in merito a gravi violazioni della protezione dei dati personali. Anche l’autorità di controllo responsabile della protezione dei dati deve essere informata
Per le aziende, il GDPR ha lo scopo di creare maggiori opportunità commerciali e promuovere l’innovazione con numerose misure. Queste possono includere:
la creazione di norme uniformi a livello dell’UE, che porteranno a importanti risparmi
la nomina di un responsabile della protezione dei dati all’interno delle autorità e delle società che si occupano di set di dati di grandi dimensioni
la designazione di un unico punto di contatto nel proprio paese a cui le imprese devono rivolgersi
la creazione di norme UE per le società di paesi terzi alle quali le società di paesi terzi devono aderire quando offrono beni o servizi o monitorano il comportamento delle persone
la creazione di regole che promuovano l’innovazione e garantiscano che le norme sulla protezione dei dati siano prese in considerazione nelle prime fasi dello sviluppo di servizi o prodotti
l’uso di tecniche compatibili con la protezione dei dati come la pseudonimizzazione (sostituzione di passaggi in un set di dati che consenta di identificare la persona associata) e la crittografia (i dati sono crittografati in modo che possano essere letti solo da persone autorizzate)
eliminare gli obblighi di segnalazione per le società al fine di promuovere la libera circolazione dei dati personali all’interno dell’Unione europea
svolgere valutazioni d’impatto quando il trattamento dei dati può costituire una minaccia per i diritti e le libertà delle persone
Un’ulteriore sfida è connessa al fatto che i dipendenti esistenti nelle aziende non hanno sempre le competenze necessarie e non sono aperti alle possibilità che l’analisi di grandi quantità di dati offre all’azienda.
Il tempo e le risorse sono spesso sprecati perché i soggetti coinvolti non hanno idee chiare sullo scopo di un progetto Big Data o su quale infrastruttura sia necessaria per esso. Trovare e trattenere dipendenti competenti è di solito difficile per le aziende, poiché sono molto richieste.
Inoltre, la tecnologia Big Data è diversificata e confusa per i principianti. Hai mai sentito parlare di Spark, Hadoop MapReduce, Cassandra o Hbase? Queste sono tecnologie Big Data con diverse funzionalità e vantaggi.
Inoltre, le tecnologie si stanno evolvendo rapidamente, quindi le aziende spesso non riescono a tenere il passo con la loro adozione. Pertanto, per le aziende che stanno valutando di utilizzare un’analisi dei Big Data, è utile la consulenza di esperti.
Un altro punto è che i progetti di Big Data sono molto costosi. Questo vale sia per le aziende che scelgono un modello locale sia per quelle che preferiscono un modello cloud. La differenza è che con un modello on-premise, l’azienda utilizza il software per big data nel proprio data center ed è responsabile del suo funzionamento e manutenzione. In un modello cloud, d’altra parte, il software viene affittato solo dall’azienda e i dati rimangono al fornitore.
Definizione
Modello On-Premise
… si riferisce a una soluzione in cui l’azienda acquista o noleggia software Big Data e lo distribuisce nel proprio centro dati. La società deve prendersi cura dell’hardware stesso e si assume anche la responsabilità dell’uso del software e i dati vengono archiviati presso l’azienda.
Definizione
Modello Cloud
… si riferisce a una soluzione in cui un’azienda acquista il software Big Data come servizio; il fornitore si assume la responsabilità della manutenzione e del funzionamento. La società paga un prezzo di noleggio che include i costi di hardware, funzionamento e manutenzione. Con questa soluzione, i dati vengono archiviati presso il provider.
Se un’azienda decide di utilizzare una soluzione locale, questa deve investire in nuovo hardware e assumere nuovi dipendenti per far funzionare e mantenere il sistema. Nel caso di una soluzione cloud, l’azienda deve solo assumere dipendenti per gestire e mantenere il sistema e l’azienda deve pagare per i servizi cloud.
Dopotutto, la qualità dei dati è spesso scarsa e le aziende devono affrontare la sfida di armonizzare i dati provenienti da diverse fonti di diversa qualità. Ad esempio, un commerciante online analizza i dati provenienti da social media, registri di siti Web, call center e siti Web che hanno formati diversi.
Ma anche quando tutti i problemi citati sono stati risolti, spesso non è così semplice per le aziende ottenere informazioni utili da grandi quantità di dati. Se le informazioni sono collegate tra loro e vengono tratte conclusioni errate, ad esempio, ciò può essere pericoloso.
Per Esempio, una persona può essere considerata non degna di fiducia da una banca che esegue un’analisi dei Big Data perché vive nello stesso quartiere di molte persone ritenute a rischio e guida la stessa macchina di molte persone considerate a rischio. Il seguente esempio mostra anche perché l’uso corretto di grandi quantità di dati è cruciale:
Esempio
Un rivenditore online si affida alla Big Data Analytics, che si basa su dati storici sul comportamento dei clienti. Si scopre che le persone che acquistano scarpe da ginnastica nere spesso aggiungono un paio di calze da ginnastica nere. Il rivenditore regola di conseguenza la sua scelta di una nuova gamma per la primavera. Tuttavia, poco prima dell’inizio della primavera, un noto rapper pubblica una sua foto con scarpe da ginnastica nere e calze gialle su Instagram. Molti giovani sono quindi alla ricerca di calze gialle da abbinare alle loro sneaker nere, ma sfortunatamente il rivenditore online si esaurisce presto perché non era preparato per la corsa. Il rivenditore ha semplicemente utilizzato la strategia sbagliata per i Big Data, basandosi solo sui risultati storici e ignorando altre importanti fonti di dati come social media, negozi di concorrenti, ecc..
Ricorda
In sintesi, queste sono le principali sfide che le aziende devono affrontare quando utilizzano i Big Data:
garantire la sicurezza dei dati – in accordo con il GDPR
le competenze professionali dei dipendenti – uso competente di tecnologie in rapido progresso
alti costi dei progetti Big Data (hardware e software o costi di noleggio, personale, manutenzione ecc.)
scarsa qualità dei dati, standardizzazione dei dati in diversi formati e con diversa qualità
corretta interpretazione dei dati
Come hai notato, i Big Data offrono enormi possibilità e opportunità che le aziende non si sono nemmeno avvicinate allo sfruttamento. Tuttavia, i grandi volumi di dati sono anche associati a sfide e rischi che non devono essere sottovalutati e sono inquietanti per molte persone. Il fattore decisivo per garantire che i Big Data vengano utilizzati con successo senza causare danni ad altre persone è quindi la gestione responsabile e competente dei grandi volumi di dati.
Nei capitoli precedenti hai assistito alla complessità dell’analisi e dell’utilizzo dei Big Data. Almeno altrettanto complesse sono le sfide e i rischi associati a grandi quantità di dati. Probabilmente la più grande sfida per le aziende in relazione ai Big Data è la protezione dei dati:
Sebbene le aziende abbiano prestato maggiore attenzione alla protezione dei dati negli ultimi anni, ci sono ancora problemi. Ad esempio, i dati personali degli utenti di Internet possono essere utilizzati senza il loro consenso e le persone interessate possono essere identificate, controllate e nel peggiore dei casi ricattate.
Definizione
Dati personali
fa riferimento a dati che si riferiscono a una persona e consente di trarre conclusioni sulla sua personalità. Ciò include, ad esempio, il numero di targa di Mario Bianchi, la data di nascita del tuo vicino o il saldo del conto di Bill Gates.
Un esempio di violazione della protezione dei dati in relazione ai Big Data è il caso del portale di lancio di Ashley Madison, che è già stato menzionato come Esempio nel capitolo 2. In questo caso, i dati personali sono diventati pubblici e sono stati utilizzati per ricattare i proprietari di i dati.
Le normative e le leggi sulla protezione dei dati aiutano a proteggere i consumatori dagli abusi. La base della legge generale sulla protezione dei dati nell’Unione europea e in Austria è il regolamento generale sulla protezione dei dati, entrato in vigore il 25 maggio 2018.
Excursus
Il Regolamento Generale di Protezione dei Dati – GDPR
Il regolamento generale sulla protezione dei dati, o GDPR in breve, è chiamato nella sua interezza “Regolamento (UE) 2016/679 del Parlamento europeo e del Consiglio, del 27 aprile 2016, relativo alla protezione delle persone fisiche con riguardo al trattamento dei dati personali, nonché alla libera circolazione di tali dati e che abroga la direttiva 95/46/CE”.
Questo regolamento consente ai cittadini dell’UE di controllare meglio la raccolta e l’uso dei propri dati personali. Ciò dovrebbe rafforzare la fiducia dei consumatori nelle singole società. I diritti esistenti dei cittadini dell’UE sono consolidati nel GDPR e vengono anche stabiliti nuovi diritti. I diritti stabiliti nel GDPR includono:
Per le aziende, il GDPR ha lo scopo di creare maggiori opportunità commerciali e promuovere l’innovazione con numerose misure. Queste possono includere:
Il GDPR completo può essere consultato a https://eur-lex.europa.eu/legal-content/IT/ALL/?uri=CELEX:32016R0679.
Un’ulteriore sfida è connessa al fatto che i dipendenti esistenti nelle aziende non hanno sempre le competenze necessarie e non sono aperti alle possibilità che l’analisi di grandi quantità di dati offre all’azienda.
Il tempo e le risorse sono spesso sprecati perché i soggetti coinvolti non hanno idee chiare sullo scopo di un progetto Big Data o su quale infrastruttura sia necessaria per esso. Trovare e trattenere dipendenti competenti è di solito difficile per le aziende, poiché sono molto richieste.
Inoltre, la tecnologia Big Data è diversificata e confusa per i principianti. Hai mai sentito parlare di Spark, Hadoop MapReduce, Cassandra o Hbase? Queste sono tecnologie Big Data con diverse funzionalità e vantaggi.
Inoltre, le tecnologie si stanno evolvendo rapidamente, quindi le aziende spesso non riescono a tenere il passo con la loro adozione. Pertanto, per le aziende che stanno valutando di utilizzare un’analisi dei Big Data, è utile la consulenza di esperti.
Un altro punto è che i progetti di Big Data sono molto costosi. Questo vale sia per le aziende che scelgono un modello locale sia per quelle che preferiscono un modello cloud. La differenza è che con un modello on-premise, l’azienda utilizza il software per big data nel proprio data center ed è responsabile del suo funzionamento e manutenzione. In un modello cloud, d’altra parte, il software viene affittato solo dall’azienda e i dati rimangono al fornitore.
Definizione
Modello On-Premise
… si riferisce a una soluzione in cui l’azienda acquista o noleggia software Big Data e lo distribuisce nel proprio centro dati. La società deve prendersi cura dell’hardware stesso e si assume anche la responsabilità dell’uso del software e i dati vengono archiviati presso l’azienda.
Definizione
Modello Cloud
… si riferisce a una soluzione in cui un’azienda acquista il software Big Data come servizio; il fornitore si assume la responsabilità della manutenzione e del funzionamento. La società paga un prezzo di noleggio che include i costi di hardware, funzionamento e manutenzione. Con questa soluzione, i dati vengono archiviati presso il provider.
Se un’azienda decide di utilizzare una soluzione locale, questa deve investire in nuovo hardware e assumere nuovi dipendenti per far funzionare e mantenere il sistema. Nel caso di una soluzione cloud, l’azienda deve solo assumere dipendenti per gestire e mantenere il sistema e l’azienda deve pagare per i servizi cloud.
Dopotutto, la qualità dei dati è spesso scarsa e le aziende devono affrontare la sfida di armonizzare i dati provenienti da diverse fonti di diversa qualità. Ad esempio, un commerciante online analizza i dati provenienti da social media, registri di siti Web, call center e siti Web che hanno formati diversi.
Ma anche quando tutti i problemi citati sono stati risolti, spesso non è così semplice per le aziende ottenere informazioni utili da grandi quantità di dati. Se le informazioni sono collegate tra loro e vengono tratte conclusioni errate, ad esempio, ciò può essere pericoloso.
Per Esempio, una persona può essere considerata non degna di fiducia da una banca che esegue un’analisi dei Big Data perché vive nello stesso quartiere di molte persone ritenute a rischio e guida la stessa macchina di molte persone considerate a rischio. Il seguente esempio mostra anche perché l’uso corretto di grandi quantità di dati è cruciale:
Esempio
Un rivenditore online si affida alla Big Data Analytics, che si basa su dati storici sul comportamento dei clienti. Si scopre che le persone che acquistano scarpe da ginnastica nere spesso aggiungono un paio di calze da ginnastica nere. Il rivenditore regola di conseguenza la sua scelta di una nuova gamma per la primavera. Tuttavia, poco prima dell’inizio della primavera, un noto rapper pubblica una sua foto con scarpe da ginnastica nere e calze gialle su Instagram. Molti giovani sono quindi alla ricerca di calze gialle da abbinare alle loro sneaker nere, ma sfortunatamente il rivenditore online si esaurisce presto perché non era preparato per la corsa. Il rivenditore ha semplicemente utilizzato la strategia sbagliata per i Big Data, basandosi solo sui risultati storici e ignorando altre importanti fonti di dati come social media, negozi di concorrenti, ecc..
Ricorda
In sintesi, queste sono le principali sfide che le aziende devono affrontare quando utilizzano i Big Data:
Come hai notato, i Big Data offrono enormi possibilità e opportunità che le aziende non si sono nemmeno avvicinate allo sfruttamento. Tuttavia, i grandi volumi di dati sono anche associati a sfide e rischi che non devono essere sottovalutati e sono inquietanti per molte persone. Il fattore decisivo per garantire che i Big Data vengano utilizzati con successo senza causare danni ad altre persone è quindi la gestione responsabile e competente dei grandi volumi di dati.