Kategorien
Blog

Was ist Big Data eigentlich?

Was ist Big Data eigentlich?

Kurz gesagt, handelt es sich um elektronische Datensätze in gigantischen Mengen. So groß, dass diese Daten nicht im herkömmlichen Sinne gespeichert oder verarbeitet werden können. Zumindest nicht in angemessener Zeit und mit traditionellen Methoden.

Diese Datenmenge wird nicht einfach nur in Megabyte oder Gigabyte gemessen, nach dem Motto: Ab „x“ GB heißt es Big Data. Stattdessen definiert der Kontext, ob es sich um Big Data handelt oder nicht.

Beispielsweise kann man eine Datei mit einer Größe von 120 Megabyte als Big Data bezeichnen, wenn sie ein E-Mail-Anhang ist. Heutzutage beansprucht das Hoch- und Herunterladen dieser Datei zu viel Zeit. Die Datenmenge bringt die Leistung der Soft- und Hardware an die Grenzen ihrer Kapazität und unterbricht einen sinnvollen Arbeitsfluss. In diesem Kontext sind 120 Megabyte also Big Data, während in einem anderen Kontext die gleiche Datenmenge keinesfalls Big Data wäre – etwa wenn ein Firma ihre täglichen Datensicherung durchführt.

Big-Data

Ein anderes Beispiel ist der Datenstrom in sozialen Netzwerken wie Facebook, oder Videoplattformen wie YouTube. Die schiere Menge der Teilnehmer, Bilddateien, Nachrichten und so weiter stellt die Betreiber dieser Seiten vor die Herausforderung, all diese Daten in angemessener Zeit zu speichern, verarbeiten und sichern. Durch den Einbau einer größeren Festplatte ist das nicht möglich, sondern nur durch massives Anpassen des Datenmanagements.

Und genau das ist eines der großen Themen der heutigen Zeit. Datenmengen wachsen und spielen auch dort eine Rolle, wo dies vor kurzer Zeit nicht der Fall war. Ein Parkhausbetreiber verwendete bisher Parkscheine aus Papier, jetzt aber betreibt er eine Handy-App, die schnell Datenmengen produziert: Big Data.

Daneben spielen auch andere Faktoren eine Rolle bei der Definition, wie zum Beispiel die Vielseitigkeit der Daten. Das System muss unterscheiden, ob es sich um Bilddaten, Adressen oder Texte handelt, und wie mit diesen verschiedenen Arten umzugehen ist. Wie werden die Daten eingeordnet, was bedeuten sie, und sind sie vertrauenswürdig? Jeder von uns kennt die Herausforderung, eine Statistik sinnvoll auszuwerten – nicht anders ist dies im Big-Data-Bereich. Es muss festgestellt werden, ob diese Daten für eine Organisation überhaupt sinnvoll sind.