Die wachsende Welt großer Datenmengen

© Gorodenkoff / Shutterstock

Big Data – große Datenmengen – ist ein wachsendes Forschungsgebiet in Deutschland, von dem man sich erhofft, dass es alles vom Transport bis zum Gesundheitswesen verbessern wird. Dr. Kristian Kersting ist einer von vielen deutschen Forschern, die versuchen, die von uns generierten Daten für uns zu nutzen.

Dr. Kristian Kersting verbringt viel Zeit im Stau. Kersting pendelt von seinem Wohnort in Bonn zur Technischen Universität (TU) Dortmund, wo er Professor für Informatik ist, und hat eine Menge Leerlauf, währenddessen er Kollegen anrufen, E-Mails versenden, Social-Media- oder Nachrichten-Websites durchsuchen kann. In diesen Momenten ist Dr. Kersting nur einer von mehr als sechs Milliarden Mobilfunknutzern weltweit, die Informationen über ihren Standort, ihre persönlichen Interessen und sogar ihre Gesundheits- und Kaufgewohnheiten in den größten Datenspeicher, der jemals über Menschen und ihr Verhalten erfasst wurde, beisteuern.

Noch vor nur fünfzehn Jahren beschworen die Worte „Big Data“ Bilder von riesigen Serverräumen herauf, vibrierend mit dem Summen von Kühlventilatoren und blinkend mit Tausenden von kleinen Lichtern. Die massiven Datenströme, die allen Branchen, von der Logistik über die Fertigung bis hin zu Medien und Werbung, zugeführt werden, werden heute zunehmend von kleinen, kostengünstigen Geräten erzeugt. Dazu gehören Smartphones ebenso wie kundenspezifische Sensoren, die von atmosphärischen Partikeln bis hin zu den Verkehrsstaus, in denen Dr. Kersting oft festsitzt, alles analysieren.

Die Herausforderung der vergangenen Jahrzehnte, genügend Daten zu sammeln, um aussagekräftige Analysen zu liefern, wurde durch eine ebenso große, aber entgegengesetzte Herausforderung abgelöst, nämlich: Wie kann man den fast unergründlich großen Fundus an Informationen, der täglich von einer wachsenden Zahl von Menschen und Geräten auf dem Planeten erzeugt wird, am besten speichern, analysieren und nutzen?

Da sich die Datenmenge, die wir produzieren, jedes Jahr verdoppelt, werden Innovation und Management großer Datenmengen für den wirtschaftlichen Wohlstand der Weltwirtschaften, einschließlich Deutschlands, als von zentraler Bedeutung erachtet.

Ein starkes Fundament öffentlicher und privater Unterstützung bildet die Grundlage für Deutschlands Bemühungen, im Bereich der Big-Data-Analyse und -Bereitstellung führend zu werden. Dazu gehören auch spezialisierte Zentren für Datenforschung an Universitäten im ganzen Land sowie Branchenpartner wie IBM und Cisco, die beide erhebliche Investitionen in die Beschleunigung der F+E von Big Data in Deutschland getätigt haben. Das Berlin Big Data Center, Deutschlands erstes eigenständiges Zentrum für Großdatenforschung, wurde 2014 mit dem Ziel gegründet, die Innovationspipeline zu speisen und eine neue Generation von Datenwissenschaftlern auszubilden.

Erkenntnisse aus Daten gewinnen

„Wie man aus Daten Erkenntnisse gewinnt, ist alles“, sagt Dr. Katharina Morik, Leiterin des Sonderforschungsbereichs 876 und Professorin für Informatik an der TU Dortmund. Dr. Morik ist eine von Tausenden von Forschern in Deutschland, die Systeme entwickeln, um die nützlichsten Informationen aus einem Meer von Daten herauszufiltern und sie in fast jeder Branche nutzbar zu machen. Solche Erkenntnisse lassen sich nur gewinnen, wenn man große Datenmengen mit künstlicher Intelligenz verknüpft – auf Engste miteinander verbundene Felder, die sich gegenseitig informieren und weiterentwickeln, wobei das eine die Rohinformationen liefert und das andere die Fähigkeit besitzt, diese Informationen auf pragmatische und neuartige Weise zu extrahieren, zu destillieren und zu nutzen.

Big Data und KI kommen durch maschinelles Lernen zusammen, wodurch robotergesteuerte und automatisierte Systeme kontinuierlich aus Echtzeit-Datenfeeds lernen können. Die Verbindung von großen Datenmengen und KI hat Roboter hervorgebracht, die in der Lage sind, bei der Durchführung von Operationen zu helfen und therapeutisch mit entwicklungsbehinderten Kindern zu arbeiten. Sie hat ferner die Bereiche Logistik, Gesundheitswesen, Werbung, Transport, Einzelhandel, Fertigung und zahlreiche andere Branchen grundlegend verändert. Unterstützt von großen Datenmengen haben Wissenschaftler ausgeklügelte maschinelle Lernalgorithmen entwickelt, die in der Lage sind, menschliches Verhalten vorherzusagen. Solche Algorithmen lassen sich für gezielte Werbung und die Beeinflussung von Kaufentscheidungen einsetzen und können weitreichende Auswirkungen auf Bereiche wie die globale öffentliche Gesundheit haben, in denen die über Smartphones erhobenen Daten es Wissenschaftlern ermöglichen können, Ausbrüche von Infektionskrankheiten zu erkennen und zu überwachen und die Katastrophenvorsorge zu verbessern.

Signal und Rauschen

Experten wie Dr. Morik sind sich einig, dass die optimale Nutzung großer Datenmengen zum Teil auf der Integration von Echtzeit-Analysen in die Geräte selbst beruht – eine Herausforderung, die sie und ihre Kollegen sowie andere auf der ganzen Welt dabei sind, schnell zu lösen. Einige Prognosen gehen davon aus, dass das Internet der Dinge bis 2020 mehr als 25 Milliarden verbundene Objekte umfassen wird. Andere schätzen, dass bis 2025 rund eine Billion intelligente Sensoren Daten streamen werden. Selbst bei revolutionären Bandbreitenverbesserungen stellen diese Zuwächse eine massive Belastung für drahtlose Netzwerke dar. Durch die Integration von Smart Analytics direkt in ein Gerät – beispielsweise einen Verkehrssensor oder einen Smart-Container-Sensor zur Verfolgung von Frachtsendungen – werden über das Netzwerk nur die für die jeweilige Aufgabe notwendigen Informationen übertragen, sei es zur Umleitung von Pendlern oder zur Verbesserung einer Schifffahrtsroute. „Wir können die Datenmenge reduzieren, so dass wir nur das gute Signal erhalten und nicht das ganze Rauschen mit abbekommen“, erklärte Dr. Morik.

Dr. Kersting glaubt, dass Forscher in Deutschland und weltweit gerade erst damit beginnen, das volle Potenzial großer Datenmengen auszuschöpfen. „Ich vergleiche die Fortschritte, die wir heute machen, mit den frühen Durchbrüchen von Mikroskopen und Teleskopen – Innovationen, die es uns ermöglichten, Dinge zu betrachten, die wir noch nie gesehen hatten“, so Dr. Kersting. „Das ist der Traum der Menschheit – einen Blick von dem zu erhaschen, was vorher nicht bekannt war. Wir bringen Licht in dunkle Daten.“