Das Wichtigste in Kürze:
Big Data ist ein englischer Begriff, der verwendet wird, um außerordentlich große Datenmengen zu beschreiben. Daten dieser Art zeichnen sich dabei durch ihr Ausmaß, ihre hohe Komplexität, ihre Geschwindigkeit und eine schwache Strukturierung aus (Prognose von Statista).
Der Big-Data-Begriff befindet sich jedoch in einem ständigen Wandel. So wird Big Data umgangssprachlich auch als Sammelbegriff für neuartige digitale Technologien verwendet. Dazu zählen in erster Linie Technologien, die für das Erheben und Auswerten dieser Datenmengen abzielen (z.B. Cloud-Computing).
Big-Data-Technologien sind derweil mit einschneidenden Innovationen in der digitalen Kommunikations- und Verarbeitungsbranche verbunden, die im Rahmen von Industrie 4.0 den digitalen Wandel vorantreiben.
Ebenso schwingt stets eine gesellschaftliche Komponente beim Begriff Big Data mit. Denn infolge der rapiden digitalen Entwicklung, die Big Data ermöglicht, kommt es ebenfalls zu sozialen Umbrüchen.
Prof. Dr. Oliver Bendel vom Institut für Wirtschaftsinformatik der Fachhochschule Nordwestschweiz (FHNW), definiert den Begriff Big Data im Gabler Wirtschaftslexikon wie folgt: Big Data sind große Mengen an Daten, die auf Basis spezieller Lösungen gespeichert, verarbeitet und ausgewertet werden. Ziel von Big Data ist der Wissenserwerb durch:
Von Experten auf dem Gebiet wird Big Data auf Deutsch als Massendaten oder Megadaten bezeichnet.
Ab welcher Datenmenge genau von Big Data gesprochen wird, ist nicht konkret definiert. Grundsätzlich handelt es sich bei Big Data allerdings um Datenmengen im oberen Terabyte- oder Petabyte-Bereich, so wie alles, was darüber hinaus geht.
Das Speichern immenser Datenmengen zum Zweck der Datenanalyse ist kein neues Phänomen. Der Begriff Big Data selbst entsteht jedoch erst in den 2000er Jahren. Zum ersten Mal fällt dieser im 3-V-Modell des Branchenanalytikers Doug Laney.
Big Data basiert grundsätzlich auf folgenden drei Merkmalen:
Zudem haben sich für Unternehmen noch die folgenden drei Merkmale von Big Data als wesentlich herauskristallisiert:
Big Data funktioniert über Datenflüsse (strukturierte, halbstrukturierte und unstrukturierte Daten), die über unterschiedliche Orte, Quellen, Systeme, Eigentümer und Nutzer verbunden sind. Um dieses Geflecht aus Daten gezielt nutzen zu können, sind 5 Schritte erforderlich:
Big Data wird aus vielen verschiedenen Quellen bezogen. Dementsprechend sind verschiedene Arten von Daten zu berücksichtigen. Im Folgenden die wichtigsten Arten von Big Data:
Wichtig: Zur Datenverarbeitung und -analyse von unstrukturierten und halbstrukturierten Daten, ist es notwendig diese mit einem Data-Mining-Tool bzw. einem Datenaufbereitungstool aufzubereiten und umzuwandeln.
Im Zeitalter der Digitalisierung und dem Internet der Dinge, ist Big Data für Unternehmen entscheidend, damit sie wettbewerbsfähig bleiben. Dabei kommt es nicht auf die Datenmenge an sich an. Vielmehr ist es ausschlaggebend, wie Sie mit dem vorhandenen Datenvolumen umgehen.
Bei korrekter Anwendung erlauben es Ihnen Big-Data-Technologien Kosten und Zeit zu sparen, zielgruppenspezifische Angebote bereitzustellen und fundierte Entscheidungen auf Grundlage von Daten zu treffen.
Big Data Analytics ist eine in der Business Intelligence (BI) angesiedelte Methode zur Datenanalyse von großen Datenmengen. Bei dieser Methode werden mithilfe von Big-Data-Software parallel Datenbestände unterschiedlicher Informationstypen ausgewertet. Zu den zentralen Aufgaben von Big Data Analytics zählen zudem:
Big Data Analytics sind heutzutage für viele Branchen ausschlaggebend, da sie gezwungen sind sich an die rasanten Marktentwicklungen anzupassen. In diesem Sinne werden auf Grundlage von Big Data Analytics Trends in den unterschiedlichen Geschäftsfeldern eines Unternehmens prognostiziert.
Darüber hinaus nutzen Unternehmen Big Data Analytics, um Wettbewerbsvorteile auszubauen. Beispielsweise können Einsparungen erzielt sowie neue Geschäftsfelder ergründet werden.
Inzwischen gehört Big Data Analytics zu den wichtigsten Anwendungen in der BI. Am meisten profitieren hier Suchmaschinenbetreiber und Betreiber sozialer Netzwerke von Big Data Analytics.
Die Verarbeitung von Massendaten schafft ausreichend Raum für Innovationen. Kein Wunder also, dass mit dem Aufstieg von Big Data zahlreiche neue Big-Data-Technologien entstanden sind:
Bei der Analyse von Big Data kommen unterschiedliche Techniken zum Einsatz. Am häufigsten werden die folgenden angewendet:
SQL ist das Kürzel für „Structured Query Language“. Es handelt sich hierbei um eine Programmiersprache zur Verwaltung und Abfrage von strukturierten Daten in relationalen Datenbanken.
Fällt der Begriff SQL im Zusammenhang mit Big Data, so ist damit gemeint, dass diese Programmiersprache bei großen Datenmengen sowie unstrukturierten Daten angewendet wird (z.B. in Hadoop und NoSQL-Datenbanken).
Hierzu werden speziell auf Big Data zugeschnittene SQL-Erweiterungen genutzt (z.B. Hive). Hauptsächlich dient SQL in Big Data dazu, Daten unterschiedlicher Quellen und Formate zu extrahieren, umzuwandeln und zu untersuchen.
Big Data wird in fast allen Geschäftsprozessen eines Unternehmens eingesetzt, um Betriebsabläufe zu optimieren, besseren Kundenservice zu leisten oder neue Produkte und Dienstleistungen auf den Markt zu bringen.
Insbesondere Marktforschung und Marketing, Informationstechnik, Forschung und Entwicklung sowie die Verwaltung profitieren von der Datenanalyse auf Basis von Massendaten. Aber auch Einsatzgebiete wie die Medizin und Nachrichtendienste profitieren von Big Data.
Unternehmen aus den unterschiedlichsten Branchen nutzen Big Data. Ferner noch gibt es kaum noch einen Bereich, in dem nicht die ein oder andere Big-Data-Technologie zum Einsatz kommt. Unter anderem findet Big Data Anwendung in den folgenden Branchen:
Banken verwenden Big Data mit dem Zweck, die Bonität mehrerer Kunden in kurzer Zeit auszuwerten. Des Weiteren liefert das sogenannte Big-Data-Scoring weitaus genauere Ergebnisse als das klassische Kreditscoring.
Im Marketing wird Big Data dazu verwendet, Erkenntnisse zum Kaufverhalten von Zielgruppen abzuleiten. Unter anderem ermöglicht es Big Data zu erschließen:
Auf Basis dieser Erkenntnisse entwickeln Marketingexperten Kampagnen, um neue Kunden zu gewinnen, Anzeigen zu platzieren, die Kundenbindung zu erhöhen, verlorene Kunden zurückzugewinnen oder neue Produkte bzw. Leistungen zu launchen. Ferner noch ist auf diese Weise ein gezielter Einsatz des Marketingbudgets möglich.
Ebenso wird Big Data zur Risikoprophylaxe genutzt, um der rechtswidrigen Nutzung von digitalen Produkten oder Leistungen vorzubeugen. So erlauben es Big Data Analytics bereits früh Unstimmigkeiten festzustellen. Genauso erkennen Big Data Technologien unerwünschte oder fehlerhafte Transaktionen, sodass diese mit minimalem Aufwand behoben werden können.
Gerade im Controlling kommt es durch Big Data zu zahlreichen einschneidenden Veränderungen. Dazu zählt unter anderem:
Die Daten für Big Data werden überall dort gesammelt, wo eine Archivierung von Daten stattfindet. Das heißt in nahezu allen öffentlichen, aber auch privaten Lebensbereichen. Im Folgenden einige Beispiele für Big-Data-Quellen:
Hinweis: Da Unternehmen so viele Daten wie möglich sammeln wollen, um eine möglichst präzise Analyse zu erzielen, werden oftmals Daten von Privatpersonen aufgenommen. Es kommt zum Konflikt zwischen den Interessen der Privatperson und Behörden sowie den Unternehmenszielen.
Eine Möglichkeit dieses Dilemma zu umgehen ist eine Anonymisierung der erfassten Daten durchzuführen. Auf diese Weise kann das Unternehmen weiterhin Daten aufnehmen, während die Privatsphäre der Privatperson geschützt bleibt.
Die schiere Datenmenge und Datenvielfalt sowie die Geschwindigkeit von Daten ist ohne eine spezielle Form der IT-Infrastruktur nicht zu bewältigen. Denn einzelne Server sowie Server-Cluster stoßen bei der Verarbeitung von Massendaten schnell an Ihre Grenzen.
Um Megadaten erfolgreich abzuspeichern sind dementsprechend Tausende Server erforderlich, die über eine Cluster-Architektur (z.B. Hadoop oder Apache Spark) miteinander kombiniert werden müssen.
Nun sind die Kosten für eine Cluster-Architektur dieser Art durchaus hoch. Alternativ greift der Großteil der Unternehmen deshalb auf eine öffentliche Cloud zurück. Public-Cloud-Lösungen wie Hadoop Distributed File System (HDFS) oder Amazon Simple Storage Service (S3) ermöglichen es den Datenspeicher unbegrenzt zu erweitern.
Der Vorteil: Das Unternehmen zahlt ausschließlich für den tatsächlich benötigten Speicherraum. Es entstehen damit keine zusätzlichen Kosten. Entsprechend geht das Voranschreiten von Big Data, mit einem Wachstum im Cloud-Computing einher.
Darüber hinaus werben einige Cloud-Anbieter (z.B. Amazon EMR, Microsoft Azure HADInsight, Google Cloud Dataproc) mit Big-Data-Verarbeitungs- und Analysediensten. Zusätzlich gibt es einige Big-Data-Lösungen für den lokalen Einsatz. Dazu zählen:
Fähigkeiten im Bereich Big Data gewinnen mit dem Ausbau von Big-Data-Technologien in nahezu allen Branchen an Bedeutung. Um den Umgang mit unterschiedlichen Big-Data-Tools, Techniken und Technologien zu erlernen, können Sie eine Big-Data-Weiterbildung absolvieren. In diesem Zusammenhang gibt es Fort- und Weiterbildungen zum Data Scientist, Data Analyst, Data Engineer und Machine Learning Engineer.
Big Data beschreibt gewaltige Datenmengen sowie die damit verbundenen Technologien. Unternehmen können diese Massendaten dazu nutzen, Geschäftsprozesse zu optimieren und damit von Wettbewerbsvorteilen profitieren.
Aktuell befindet sich Big Data noch im Anfangsstadium. Gleichzeitig sind die Fortschritte von Big Data jedoch rasant, sodass davon auszugehen ist, dass Big Data die Unternehmenswelt in nahezu allen Branchen langfristig prägen wird. Dementsprechend ist es für Unternehmen essenziell, sich regelmäßig zum Thema Big Data weiterzubilden sowie in Big-Data-Lösungen zu investieren.
In einer Welt, in der Cyberangriffe alltäglich geworden sind, ist Vorsorge unerlässlich. Eine Cyber-Versicherung bewahrt Unternehmen nicht nur vor finanziellen Verlusten, sondern stellt auch Fachwissen und Hilfe im Ernstfall bereit. Sie ist das essenzielle Sicherheitsnetz, das jedes moderne Unternehmen integrieren sollte, um den stetig zunehmenden digitalen Gefahren zu trotzen.