In den vergangenen Kapiteln haben Sie gesehen, wie komplex es ist, Big Data zu analysieren und zu nutzen. Mindestens ebenso komplex sind die Herausforderungen und Risiken, die mit den großen Datenmengen verbunden sind. Die wohl größte Herausforderung für Unternehmen im Zusammenhang mit Big Data ist der Datenschutz:
Denn obwohl Unternehmen seit einigen Jahren verstärkt auf den Datenschutz achten, kommt es immer noch zu Problemen. So werden z.B. personenbezogene Daten von Internetnutzern ohne ihr Einverständnis verwendet werden und die Betroffenen können identifiziert, kontrolliert und im schlimmsten Fall erpresst werden.
Definition
Personenbezogene Daten
… bezeichnen Daten, die sich auf eine Person beziehen und Schlüsse über deren Persönlichkeit zulassen. Dazu zählen z.B. das Autokennzeichen von Werner Kogler, das Geburtsdatum Ihrer Nachbarin oder der Kontostand von Bill Gates.
Ein Beispiel für eine Datenschutzverletzung im Zusammenhang mit Big Data ist der Fall des Seitensprungportals Ashley Madison, der bereits in Kapitel 2 als Beispiel angeführt wurde. In diesem Fall gelangten die personenbezogenen Daten an die Öffentlichkeit und wurden benutzt, um die Eigentümer der Daten zu erpressen.
Datenschutzverordnungen und -gesetze helfen dabei, die Konsumenten vor Missbrauch zu schützen. Grundlage des allgemeinen Datenschutzrechts in der Europäischen Union und in Österreich ist die Datenschutz-Grundverordnung, die am 25. Mai 2018 in Kraft getreten ist.
Exkurs
Die Datenschutz-Grundverordnung
Die Datenschutz-Grundverordnung, kurz DSGVO, heißt vollständig „Verordnung (EU) 2016/679 des Europäischen Parlaments und des Rates vom 27. April 2016 zum Schutz natürlicher Personen bei der Verarbeitung personenbezogener Daten, zum freien Datenverkehr und zur Aufhebung der Richtlinie 95/46/EG“. Sie ist in Österreich unmittelbar anwendbar und wird durch das Datenschutzgesetz (DSG) und die Richtlinie für den Datenschutz ergänzt.
Diese Verordnung ermöglicht den EU-Bürgern, die Erhebung und Nutzung ihrer personenbezogenen Daten besser zu kontrollieren. Dies soll das Vertrauen der Konsumenten in die jeweiligen Unternehmen stärken. Bereits bestehende Rechte von EU-Bürgern und Bürgerinnen werden in der DSGVO gefestigt, zudem werden auch neue Rechte festgeschrieben. Die in der DSGVO festgeschriebenen Rechte umfassen:
einen vereinfachten Zugang zu personenbezogenen Daten – dazu zählt, dass umfassende, klare und verständliche Informationen zur Verarbeitung der Daten bereitgestellt werden
ein neues Recht auf Datenübertragbarkeit –personenbezogene Daten sollen vereinfacht übermittelt werden
ein eindeutigeres Recht auf Löschung („Recht auf Vergessenwerden“) –Daten werden gelöscht, wenn ein Bürger oder eine Bürgerin nicht damit einverstanden ist, dass seine oder ihre Daten verarbeitet werden und es keinen berechtigten Grund gibt, diese aufzubewahren
ein Recht auf Unterrichtung über gehackte personenbezogene Daten –Unternehmen und Organisationen informieren die betroffenen Personen unverzüglich über ernsthafte Verletzungen des Schutzes personenbezogener Daten. Zudem muss die zuständige Datenschutzaufsichtsbehörde benachrichtigt werden
Für Unternehmen soll die DSGVO mehr Geschäftsmöglichkeiten schaffen und mit zahlreichen Maßnahmen Innovationen fördern. Unter anderem zählen dazu:
die Schaffung von einheitlichen EU-weiten Vorschriften, was große Einsparungen ermöglicht
die Bestimmung eines Datenschutzbeauftragten innerhalb von Behörden und Unternehmen, die sich mit umfangreichen Datensätzen beschäftigen
die Benennung einer zentralen Anlaufstelle im eigenen Land, an die Unternehmen sich wenden müssen
die Schaffung von EU-Vorschriften für Unternehmen aus Drittländern, an die sich Unternehmen aus Drittländern halten müssen, wenn sie Waren oder Dienstleistungen anbieten, oder beobachten, wie Personen sich verhalten
die Schaffung von innovationsfördernden Vorschriften, die gewährleisten, dass die Datenschutzbestimmungen bereits in einer frühen Phase der Entwicklung von Dienstleistungen oder Produkten berücksichtigt werden
die Anwendung von datenschutzgerechten Techniken wie Pseudonymisierung (Ersetzen von Stellen in einem Datensatz, die eine Identifikation der zugehörigen Person möglich machen) und Verschlüsselung (Daten werden so verschlüsselt, dass sie nur von befugten Personen gelesen werden können)
Beseitigung von Meldepflichten für Unternehmen, um den freien Verkehr personenbezogener Daten innerhalb der Europäischen Union zu fördern
Durchführung von Folgenabschätzungen, wenn die Verarbeitung der Daten die Rechte und Freiheiten von Personen mit hoher Wahrscheinlichkeit bedrohen könnte.
Eine weitere Herausforderung ist, dass die bestehenden Mitarbeiter und Mitarbeiterinnen in Unternehmen nicht immer über das erforderliche Fachwissen verfügen und daher nicht offen für die Möglichkeiten sind, die die Analyse der großen Datenmengen für das Unternehmen bereithält.
So werden oftmals Zeit und Ressourcen vergeudet, weil den Beteiligten nicht klar ist, welches Ziel ein Big-Data-Projekt verfolgt oder welche Infrastruktur dafür erforderlich ist. Kompetente Mitarbeiter und Mitarbeiterinnen zu finden und zu halten ist für Unternehmen meist schwierig, da diese sehr gefragt sind.
Zudem ist die Big-Data-Technologie vielfältig und für Einsteiger verwirrend. Haben Sie schon einmal von Spark, Hadoop MapReduce, Cassandra oder Hbase gehört? Hierbei handelt es sich um Big-Data- Technologien mit verschiedenen Eigenschaften und Vorzügen.
Zudem entwickeln sich die Technologien auch noch in einem rasanten Tempo weiter, sodass Unternehmen mit der Einführung oftmals einfach nicht hinterherkommen. Für Unternehmen, die mit dem Gedanken spielen, eine Big-Data-Analyse einzusetzen, ist daher eine fachkundige Beratung sinnvoll.
Ein weiterer Punkt ist, dass Big-Data-Projekte sehr kostspielig sind. Dies gilt sowohl für Unternehmen, die sich für ein On-Premise-Modell entscheiden als auch für jene, die ein Cloud-Modell vorziehen. Der Unterschied ist, dass das Unternehmen die Big-Data-Software bei einem On-Premise-Modell im eigenen Rechenzentrum einsetzt und die Verantwortung für den Betrieb und die Wartung trägt. Bei einem Cloud-Modell hingegen wird die Software vom Unternehmen nur gemietet und die Daten verbleiben beim Anbieter.
Definition
On-Premise-Modell
…bezeichnet eine Lösung, bei der das Unternehmen Big-Data-Software kauft oder mietet und diese in seinem eigenen Rechenzentrum einsetzt. Um die Hardware muss das Unternehmen sich selbst kümmern, zudem übernimmt das Unternehmen die Verantwortung für die Nutzung der Software und die Daten werden beim Unternehmen gespeichert.
Definition
Cloud-Modell
…bezeichnet eine Lösung, bei der ein Unternehmen die Big-Data-Software als Dienstleistung bezieht, die Verantwortung für Wartungs- und Betrieb übernimmt der Anbieter. Das Unternehmen bezahlt einen Mietpreis, in dem die Hardware, der Betrieb und der Wartungsaufwand enthalten sind. Die Daten werden bei dieser Lösung beim Anbieter gespeichert.
Entscheidet sich ein Unternehmen für eine On-Premises-Lösung, muss es in neue Hardware investieren und neue Mitarbeitende einstellen, die das System bedienen und warten. Im Falle einer Cloud-Lösung müssen nur für die Bedienung und Wartung Mitarbeitende aufgenommen werden, zudem muss das Unternehmen die Kosten für die Cloud-Services tragen.
Schließlich ist die Qualität der Daten oft mangelhaft und Unternehmen stehen vor der Herausforderung, Daten aus verschiedenen Quellen mit verschiedener Qualität zu vereinheitlichen. Beispielsweise. analysiert ein Online-Händler Daten aus sozialen Medien, Webseite-Protokollen, Callcentern und Webseiten, die verschiedene Formate haben.
Aber selbst wenn alle angesprochenen Probleme gelöst sind, ist es für Unternehmen oftmals gar nicht so einfach, aus den großen Datenmengen nützliche Erkenntnisse zu gewinnen. Denn wenn z.B. Informationen miteinander verknüpft werden und daraus falsche Schlüsse gezogen werden, kann das gefährlich sein.
So kann etwa eine Person von einer Bank, die eine Big-Data-Analyse durchführt, als kreditunwürdig eingestuft werden, weil sie im selben Stadtviertel wohnt wie viele kreditunwürdige Personen und dasselbe Auto fährt wie zahlreiche als kreditunwürdig eingestufte Menschen. Auch das folgende Beispiel zeigt, warum die richtige Nutzung der großen Datenmengen so entscheidend ist:
Beispiel
Ein Online-Händler setzt auf Big-Data-Analytics, die sich auf historische Daten über das Verhalten der Kundinnen und Kunden stützt. So stellt sich heraus, dass Menschen, die schwarze Sneakers kaufen, oftmals auch ein Paar schwarze Sneaker-Socken dazu nehmen. Der Händler passt sein Sortiment für das Frühjahr dementsprechend an. Kurz vor Frühlingsbeginn postet aber ein bekannter Rapper auf Instagram ein Foto von sich mit schwarzen Sneakers und gelben Socken. Zahlreiche junge Leute sind daher auf der Suche nach gelben Socken zu ihren schwarzen Sneakers, die der Online-Händler aber leider schon bald nicht mehr vorrätig hat, weil er auf den Ansturm nicht vorbereitet war. Der Händler hat einfach die falsche Big-Data-Strategie angewandt und sich nur auf historische Ergebnisse verlassen und weitere wichtige Datenquellen wie soziale Medien, Shops von Mitbewerbern etc. außer Acht gelassen.
Merke
Zusammengefasst sind die wesentlichen Herausforderungen, denen Unternehmen bei der Nutzung von Big Data gegenüberstehen:
Gewährleisten der Datensicherheit − Einhalten der Datenschutz-Grundverordnung (DSGVO)
Fachkompetenz der Mitarbeiter und Mitarbeiterinnen − fachkundiger Einsatz der vielfältigen und sich rasch entwickelnden Big-Data-Technologie
Hohe Kosten von Big-Data-Projekten (Hardware und Software Mietkosten, Mitarbeiter und Mitarbeiterinnen, Wartung etc.)
Mangelhafte Qualität der Daten, Vereinheitlichung von Daten in verschiedenen Formaten und mit unterschiedlicher Qualität
Richtige Interpretation der Ergebnisse
Wie Sie gesehen haben, bietet Big Data enorme Möglichkeiten und Chancen, die von Unternehmen bisher nicht annähernd ausgeschöpft werden. Mit den großen Datenmengen sind aber auch Herausforderungen und Risiken verbunden, die nicht zu unterschätzen sind und viele Menschen verunsichern. Entscheidend dafür, dass Big Data erfolgreich genutzt wird, ohne dass dabei ein Schaden für andere Menschen entsteht, ist daher auch in Zukunft ein verantwortungsvoller und sachkundiger Umgang mit den großen Datenmengen.
In den vergangenen Kapiteln haben Sie gesehen, wie komplex es ist, Big Data zu analysieren und zu nutzen. Mindestens ebenso komplex sind die Herausforderungen und Risiken, die mit den großen Datenmengen verbunden sind. Die wohl größte Herausforderung für Unternehmen im Zusammenhang mit Big Data ist der Datenschutz:
Denn obwohl Unternehmen seit einigen Jahren verstärkt auf den Datenschutz achten, kommt es immer noch zu Problemen. So werden z.B. personenbezogene Daten von Internetnutzern ohne ihr Einverständnis verwendet werden und die Betroffenen können identifiziert, kontrolliert und im schlimmsten Fall erpresst werden.
Definition
Personenbezogene Daten
… bezeichnen Daten, die sich auf eine Person beziehen und Schlüsse über deren Persönlichkeit zulassen. Dazu zählen z.B. das Autokennzeichen von Werner Kogler, das Geburtsdatum Ihrer Nachbarin oder der Kontostand von Bill Gates.
Ein Beispiel für eine Datenschutzverletzung im Zusammenhang mit Big Data ist der Fall des Seitensprungportals Ashley Madison, der bereits in Kapitel 2 als Beispiel angeführt wurde. In diesem Fall gelangten die personenbezogenen Daten an die Öffentlichkeit und wurden benutzt, um die Eigentümer der Daten zu erpressen.
Datenschutzverordnungen und -gesetze helfen dabei, die Konsumenten vor Missbrauch zu schützen. Grundlage des allgemeinen Datenschutzrechts in der Europäischen Union und in Österreich ist die Datenschutz-Grundverordnung, die am 25. Mai 2018 in Kraft getreten ist.
Exkurs
Die Datenschutz-Grundverordnung
Die Datenschutz-Grundverordnung, kurz DSGVO, heißt vollständig „Verordnung (EU) 2016/679 des Europäischen Parlaments und des Rates vom 27. April 2016 zum Schutz natürlicher Personen bei der Verarbeitung personenbezogener Daten, zum freien Datenverkehr und zur Aufhebung der Richtlinie 95/46/EG“. Sie ist in Österreich unmittelbar anwendbar und wird durch das Datenschutzgesetz (DSG) und die Richtlinie für den Datenschutz ergänzt.
Diese Verordnung ermöglicht den EU-Bürgern, die Erhebung und Nutzung ihrer personenbezogenen Daten besser zu kontrollieren. Dies soll das Vertrauen der Konsumenten in die jeweiligen Unternehmen stärken. Bereits bestehende Rechte von EU-Bürgern und Bürgerinnen werden in der DSGVO gefestigt, zudem werden auch neue Rechte festgeschrieben. Die in der DSGVO festgeschriebenen Rechte umfassen:
Für Unternehmen soll die DSGVO mehr Geschäftsmöglichkeiten schaffen und mit zahlreichen Maßnahmen Innovationen fördern. Unter anderem zählen dazu:
Durchführung von Folgenabschätzungen, wenn die Verarbeitung der Daten die Rechte und Freiheiten von Personen mit hoher Wahrscheinlichkeit bedrohen könnte.
Die vollständige Datenschutz-Grundverordnung kann unter https://eur-lex.europa.eu/legal-content/DE/ALL/?uri=CELEX%3A32016R0679 abgerufen werden.
Eine weitere Herausforderung ist, dass die bestehenden Mitarbeiter und Mitarbeiterinnen in Unternehmen nicht immer über das erforderliche Fachwissen verfügen und daher nicht offen für die Möglichkeiten sind, die die Analyse der großen Datenmengen für das Unternehmen bereithält.
So werden oftmals Zeit und Ressourcen vergeudet, weil den Beteiligten nicht klar ist, welches Ziel ein Big-Data-Projekt verfolgt oder welche Infrastruktur dafür erforderlich ist. Kompetente Mitarbeiter und Mitarbeiterinnen zu finden und zu halten ist für Unternehmen meist schwierig, da diese sehr gefragt sind.
Zudem ist die Big-Data-Technologie vielfältig und für Einsteiger verwirrend. Haben Sie schon einmal von Spark, Hadoop MapReduce, Cassandra oder Hbase gehört? Hierbei handelt es sich um Big-Data- Technologien mit verschiedenen Eigenschaften und Vorzügen.
Zudem entwickeln sich die Technologien auch noch in einem rasanten Tempo weiter, sodass Unternehmen mit der Einführung oftmals einfach nicht hinterherkommen. Für Unternehmen, die mit dem Gedanken spielen, eine Big-Data-Analyse einzusetzen, ist daher eine fachkundige Beratung sinnvoll.
Ein weiterer Punkt ist, dass Big-Data-Projekte sehr kostspielig sind. Dies gilt sowohl für Unternehmen, die sich für ein On-Premise-Modell entscheiden als auch für jene, die ein Cloud-Modell vorziehen. Der Unterschied ist, dass das Unternehmen die Big-Data-Software bei einem On-Premise-Modell im eigenen Rechenzentrum einsetzt und die Verantwortung für den Betrieb und die Wartung trägt. Bei einem Cloud-Modell hingegen wird die Software vom Unternehmen nur gemietet und die Daten verbleiben beim Anbieter.
Definition
On-Premise-Modell
…bezeichnet eine Lösung, bei der das Unternehmen Big-Data-Software kauft oder mietet und diese in seinem eigenen Rechenzentrum einsetzt. Um die Hardware muss das Unternehmen sich selbst kümmern, zudem übernimmt das Unternehmen die Verantwortung für die Nutzung der Software und die Daten werden beim Unternehmen gespeichert.
Definition
Cloud-Modell
…bezeichnet eine Lösung, bei der ein Unternehmen die Big-Data-Software als Dienstleistung bezieht, die Verantwortung für Wartungs- und Betrieb übernimmt der Anbieter. Das Unternehmen bezahlt einen Mietpreis, in dem die Hardware, der Betrieb und der Wartungsaufwand enthalten sind. Die Daten werden bei dieser Lösung beim Anbieter gespeichert.
Entscheidet sich ein Unternehmen für eine On-Premises-Lösung, muss es in neue Hardware investieren und neue Mitarbeitende einstellen, die das System bedienen und warten. Im Falle einer Cloud-Lösung müssen nur für die Bedienung und Wartung Mitarbeitende aufgenommen werden, zudem muss das Unternehmen die Kosten für die Cloud-Services tragen.
Schließlich ist die Qualität der Daten oft mangelhaft und Unternehmen stehen vor der Herausforderung, Daten aus verschiedenen Quellen mit verschiedener Qualität zu vereinheitlichen. Beispielsweise. analysiert ein Online-Händler Daten aus sozialen Medien, Webseite-Protokollen, Callcentern und Webseiten, die verschiedene Formate haben.
Aber selbst wenn alle angesprochenen Probleme gelöst sind, ist es für Unternehmen oftmals gar nicht so einfach, aus den großen Datenmengen nützliche Erkenntnisse zu gewinnen. Denn wenn z.B. Informationen miteinander verknüpft werden und daraus falsche Schlüsse gezogen werden, kann das gefährlich sein.
So kann etwa eine Person von einer Bank, die eine Big-Data-Analyse durchführt, als kreditunwürdig eingestuft werden, weil sie im selben Stadtviertel wohnt wie viele kreditunwürdige Personen und dasselbe Auto fährt wie zahlreiche als kreditunwürdig eingestufte Menschen. Auch das folgende Beispiel zeigt, warum die richtige Nutzung der großen Datenmengen so entscheidend ist:
Beispiel
Ein Online-Händler setzt auf Big-Data-Analytics, die sich auf historische Daten über das Verhalten der Kundinnen und Kunden stützt. So stellt sich heraus, dass Menschen, die schwarze Sneakers kaufen, oftmals auch ein Paar schwarze Sneaker-Socken dazu nehmen. Der Händler passt sein Sortiment für das Frühjahr dementsprechend an. Kurz vor Frühlingsbeginn postet aber ein bekannter Rapper auf Instagram ein Foto von sich mit schwarzen Sneakers und gelben Socken. Zahlreiche junge Leute sind daher auf der Suche nach gelben Socken zu ihren schwarzen Sneakers, die der Online-Händler aber leider schon bald nicht mehr vorrätig hat, weil er auf den Ansturm nicht vorbereitet war. Der Händler hat einfach die falsche Big-Data-Strategie angewandt und sich nur auf historische Ergebnisse verlassen und weitere wichtige Datenquellen wie soziale Medien, Shops von Mitbewerbern etc. außer Acht gelassen.
Merke
Zusammengefasst sind die wesentlichen Herausforderungen, denen Unternehmen bei der Nutzung von Big Data gegenüberstehen:
Wie Sie gesehen haben, bietet Big Data enorme Möglichkeiten und Chancen, die von Unternehmen bisher nicht annähernd ausgeschöpft werden. Mit den großen Datenmengen sind aber auch Herausforderungen und Risiken verbunden, die nicht zu unterschätzen sind und viele Menschen verunsichern. Entscheidend dafür, dass Big Data erfolgreich genutzt wird, ohne dass dabei ein Schaden für andere Menschen entsteht, ist daher auch in Zukunft ein verantwortungsvoller und sachkundiger Umgang mit den großen Datenmengen.