Fluch und Segen der Datenflut

Auf Big Data lag der Schwerpunkt an der diesjährigen Cebit. Die Datenverwertungstechnik bietet viele Möglichkeiten: Personalisierte Medizin, verminderte Grippewellen. Die Nutzung der Datenmassen bringt aber auch Risiken mit.

Andreas Lorenz-Meyer
Merken
Drucken
Teilen
Amazon will aufgrund der ausgewerteten Datenmengen die wahrscheinlich gewünschte Ware unbestellt schon versenden. Dorthin, wo Big Data Interesse ermittelt. Dafür könnten die automatischen Mini-Drohnen hilfreich sein. Diese «Octocopter» hat Amazon bereits getestet. (Bild: dpa/Bildfunk/Amazon)

Amazon will aufgrund der ausgewerteten Datenmengen die wahrscheinlich gewünschte Ware unbestellt schon versenden. Dorthin, wo Big Data Interesse ermittelt. Dafür könnten die automatischen Mini-Drohnen hilfreich sein. Diese «Octocopter» hat Amazon bereits getestet. (Bild: dpa/Bildfunk/Amazon)

Das weltweite Datenvolumen vergrössert sich rasend schnell. Zwischen zwei und drei Zettabyte hat es 2012 betragen. Zettabyte – das ist eine Zahl mit 21 Nullen. Fragt sich, was mit dem immer weiter wachsenden Datengebirge anzufangen ist. Die Antwort könnte Big Data lauten. Dieser Begriff meint das Erfassen und Analysieren grosser Datenmengen. Verwendet werden dabei spezielle Algorithmen. Sie fischen in hohem Tempo bestimmte Informationen aus dem Datendurcheinander, das heute bei jeder Firma tagtäglich anfällt.

Erfahrung automatisieren

Donald Kossmann vom Institut für Informationssysteme an der ETH Zürich sagt, mit den Auswertungen könne Erfahrung automatisiert werden. Klassische Informatik entwickle «nur» Programme, um einen Prozess zu automatisieren. Big Data verbessere diesen Prozess, indem es die Erfahrungen anderer dazu-nimmt. Etwa bei der Wartung einer Maschine. Ob sie demnächst auszufallen droht, kann mit Hilfe der Daten anderer Maschinen vorhergesagt werden. So kommt es nicht zum unerwarteten Ausfall.

Auch der Online-Handel macht sich Big Data zunutze. Die Kaufempfehlungen von Amazon basieren auf einem streng geheimen Algorithmus, der die Erfahrungen von vielen verwertet. Dann erscheint ein beiläufiger Hinweis auf dem Bildschirm: Kunden, die dieses Buch gekauft haben, interessieren sich auch für jenes Buch. Der Konzern bereitet schon den nächsten Schritt vor. Big Data soll zu einem «vorausschauenden Versand» führen. Um Lieferzeiten zu verkürzen, werden Pakete mit bestimmten Produkten schon abgeschickt, bevor die Nutzer sie überhaupt bestellt haben. Dabei gehen die Produkte nicht auf gut Glück irgendwohin. Sondern genau in die Regionen, wo sich die Nachfrage wahrscheinlich steigern wird. Der Konzern traut seinen Algorithmen offenbar den Blick in die Zukunft zu.

Der US-Einzelhandelskonzern Walmart stiess durch Big Data auf ein unerklärliches Konsumphänomen. Ein sich nähernder Hurricane steigert – warum auch immer – das allgemeine Verlangen nach Pop Tarts, einem süssen Frühstücksgebäck.

Mit diesem Wissen wird Umsatz gemacht: Bei unruhiger Wetterlage liegen die Pop Tarts gleich am Eingang der Filialen aus. Der datengestützte Verkauf kann aber auch zu weit gehen. Ein Einzelhändler erkannte anhand von Kaufmustern sehr früh die Schwangerschaft junger Kundinnen. Diese kauften grössere Mengen unparfümierter Lotionen oder deckten sich mit Zink- und Magnesiumtabletten ein. Der Händler schickte daraufhin – ungefragt – die passenden Geschenkgutscheine.

Big Data führt wohl auch zu einer personalisierten Medizin. Die Idee: Der Arzt greift auf Patientendaten aus aller Welt zu, um schnell – nach wenigen Minuten – die beste Therapie zu finden. Mit Big Data stehe ihm ein viel grösserer Erfahrungsschatz zur Verfügung, erklärt Kossmann. Dies sei besonders wichtig bei seltenen Krankheiten oder aussergewöhnlichen Kombinationen von Krankheiten.

In Potsdam nimmt die Big-Data-Medizin schon Gestalt an. Der Hochleistungsrechner am Hasso-Plattner-Institut kann genetische Veränderungen in Echtzeit analysieren, indem er medizinische Datenbanken aus aller Welt heranzieht. Genomdaten können so binnen Sekunden analysiert werden. Die Ärzte verlieren keine Zeit mehr mit wochenlangen Recherchen.

Googles Grippewellen

Auch Internetkonzerne versuchen sich an medizinischen Prognosen. Google sagt Grippewellen vorher, indem es die regionale Häufigkeit von bestimmten Suchbegriffen auswertet. Bei der Methode sind allerdings Zweifel angebracht. Im letzten Winter schätzte «Flu Trends» die Zahl der Kranken in den USA viel zu hoch ein: zehn Millionen sollten es sein, fünf Millionen waren es. Kossmann erklärt, wie es zu der Fehlschätzung kam: «Wenn Google eine grosse Grippewelle voraussagt, dann sind die Leute vorsichtiger und waschen sich häufiger die Hände. Vorhersagen verändern also das Verhalten. Dadurch könnte eine Grippewelle eventuell sogar verhindert werden.»

Wo bei den Datenauswertungen die Privatsphäre bleibt, ist unklar. Auf den Datenschutzbeauftragten des Kantons Zürich, Bruno Baeriswyl, wirkt Big Data «wie eine Zeitbombe, für die das Datenschutzrecht keine Mittel bereitstellt, um sie zu entschärfen». Und das Unabhängige Landeszentrum für Datenschutz Schleswig-Holstein in Kiel sieht «massive Verletzungen» informationeller Grundrechte. Alles wäre mit allem kombinier- und dann auswertbar.

Häufig heisst es beruhigend, die erhobenen Daten würden ja anonymisiert. Aber sind sie dann wirklich nicht mehr zuzuordnen? Ein belgischer Mathematiker führte ein Experiment durch. Er bekam anonymisierte Mobilfunkdaten zur Auswertung. Diese nur verrieten, wann und wo sich ein Handy mit einem Funkmast verbunden hatte. Anhand einer Formel, die der Forscher entwickelte, konnten die Bewegungsmuster aber doch zugeordnet werden. Vier zufällige Datenpunkte reichten, um die Identität einer Person mit 95prozentiger Genauigkeit zu bestimmen. Anonymisiertes kann also auch wieder entanonymisiert werden.

Kossmann warnt vor einer «blinden Nutzung». Datenmassen lieferten zu jeder Frage eine Antwort, selbst zu einer unsinnigen. Etwa: Ist in einem Autobahnstau die linke oder die rechte Spur schneller? Je nach Ergebnis wechseln natürlich alle auf die schnellere Fahrbahn – die bei erneuter Auswertung die langsamere wäre. Kossmann: «Erfahrung aus der Vergangenheit ist nicht immer geeignet, etwas vorherzusagen. Wir müssen den gesunden Menschenverstand einschalten. Auch wenn die Verwendung von Big Data so bequem erscheint.»

Währung des 21. Jahrhunderts

Big Data wird als Revolution bezeichnet, als Währung des 21. Jahrhunderts. Millionen neue Arbeitsplätze sollen entstehen. Technisch steht dem Boom nichts im Weg. Denn Erfahrung kann mit immer ausgefeilteren Algorithmen immer genauer automatisiert werden, sagt Kossmann. Er gründete Teralytics, eine auf Big Data spezialisierte Firma. Den Kunden falle es häufig schwer, einen Nutzen aus ihren Datenbeständen zu ziehen. Die Kunst, sich im Datendickicht zurechtzufinden, muss erst gelernt werden.