Die Jagd nach dem Datenschatz

14. Juni 2017

Unentwegt steigt die Flut der digitalen Daten. Jedes Jahr wächst sie um 65 Prozent. Johannes Gutenberg-Stiftungsprofessor Prof. Dr. Dr. h.c. mult. Wolfgang Wahlster erklärte im Rahmen seiner Vorlesungsreihe "Künstliche Intelligenz für den Menschen: Digitalisierung mit Verstand", wie sich dieser Schatz nutzen lässt. In seinem sechsten Vortrag sprach Wahlster über "Big Data: Maschinelles Lernen und Wissensextraktion aus großen Datenmengen".

Prof. Dr. Dr. h.c. mult. Wolfgang Wahlster kommt gerade aus Ludwigshafen vom Digitalisierungsgipfel der Bundesregierung. Dort war er mit seiner Expertise ein viel gefragter Gast. Nun steht er wieder vor seinem Mainzer Publikum im größten Hörsaal der Johannes Gutenberg- Universität Mainz (JGU) und freut sich über den Zuspruch, den seine Vorlesungsreihe "Künstliche Intelligenz für den Menschen: Digitalisierung mit Verstand" erfährt: "Es ist immer wieder toll zu sehen, wie viel Interesse es hier für meine Themen gibt".

Big Data ist in aller Munde. Der Begriff schmückt zahlreiche Schlagzeilen, er weckt Hoffnungen und schürt gleichzeitig Befürchtungen. "Im Grunde sind diese Massendaten ein Wirtschaftsgut", sagt Wahlster. "Viele bezeichnen sie als das Öl oder das Gold der Zukunft." Dieser Vergleich sei allerdings nicht ganz richtig. "Daten haben ein interessante Eigenschaft: Wenn man sie nutzt, werden sie nicht verbraucht."

Computer sind nicht nur das ideale Instrument, um mit Big Data umzugehen, Computer brauchen Big Data geradezu. "Maschinelles Lernen hängt ganz entscheidend davon ab, dass wir riesige Datenmengen zur Verfügung haben. Nur so können Computer vernünftig lernen." Das unterscheidet sie vom Menschen. "Es ist bis heute ein Rätsel, wie er mit so wenigen Daten auskommt."

284 Millionen E-Mails pro Minute

Allenthalben werden heute Daten erzeugt. "Schon eine einfache Jetdüse überträgt während eines kurzen Fluges mehrere Terabyte an Daten." Daten kommen aus mobilen Netzen, von Autos oder von den Sensoren aus der modernen Fabrik. "Man kann sagen: Big Data ist überall – und das Datenwachstum geht ungebremst weiter." Um 65 Prozent vermehrt sich die Datenmasse Jahr für Jahr. Wahlster präsentiert atemberaubende Zahlen: "In jeder Minute Internet-Zeit werden 48 Stunden Video auf YouTube hochgeladen." Gut 284.000.000 E-Mails werden versendet, rund 570 neue Web-Auftritte kommen pro Minute hinzu.

Allerdings sind 95 Prozent dieser Daten unstrukturiert. Es könnte sich zum Beispiel um die PDF-Datei eines Zeitungsartikels handeln: "Die kann sich ein Mensch angucken, für einen Computer aber ist das nicht so einfach." Es sei eine große Herausforderung, Maschinen beizubringen, wie sie mehr und mehr auch auf solche Quellen zurückgreifen können. Sie suchen unter anderem nach Mustern: Sie erkennen Eigennamen und setzen sie mit Zeitangaben im Text in Verbindung.

Big Data kann in ungeheuer vielen Bereichen genutzt werden. Daten helfen bei der Mobilitäts- oder Stadtplanung, sie tragen zur Erhöhung von Energieeffizienz oder der allgemeinen Sicherheit bei. Wahlster nennt ein Projekt des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI), dessen Geschäftsführer er ist. "Wir haben ein datengetriebenes Management für Massenveranstaltungen entwickelt." Dafür greifen die Fachleute auf das Handy zu: Besucher einer Veranstaltung können eine Art App herunterladen. Computer machen die Menschenströme sichtbar, die dann über ein Leitsystem gelenkt werden können. "Das ist eine sehr interessante Technik."

Von Daten zu Wissen

Aus Daten werden Informationen extrahiert, aus Informationen entsteht Wissen. Diese Wertschöpfungskette nutzen Konzerne wie der Internet-Gigant Google sehr intensiv und höchst effektiv. "Google hat die bisher größte Wissensstruktur aufgebaut." Sie ist aus Daten entstanden, die jedem zugänglich sind. "Wenn Sie einen solchen Wissensspeicher haben, könne Sie ihn für viel gute Zwecke verwenden", erklärt Wahlster.

Die Möglichkeiten, Wissen aus Daten zu ziehen, werden ständig erweitert. So sagt der Stromverbrauch eines Hauses schon einiges über die Bewohner aus. Doch damit beginnt es erst: "Jedes elektrische Gerät hat ein eigenes Anlaufverhalten." Es hinterlässt einen Fingerabdruck in der Stromverbrauchskurve, die extrahiert werden kann. "Bei einer Kaffeemaschine können Sie sogar herausfinden, ob sie einen Espresso oder etwas anderes produziert hat. Dadurch kriegen Sie natürlich ein ganz genaues Bild." Wahlster räumt ein: "Da kann einem schon Angst und Bange werden."

Big Data kann missbraucht, aber natürlich genauso zum Nutzen des Menschen eingesetzt werden. Als ein Beispiel nennt Wahlster den Robot-Journalismus: "Jeder kann sich eine personalisierte Nachrichtenpräsentation zusammenstellen, eine persönliche Zeitung." Kunden können genau schauen, woher die eben gekauften Lebensmittel stammen: Der Rahmspinat lässt sich bis zu einem speziellen Landwirt zurückverfolgen.

Missbrauch und Misstrauen

Dann wendet sich der Stiftungsprofessor anderen Aspekten zu: "Der Missbrauch ist in allen Medien ganz extrem – und das war eigentlich schon immer so." In der Reformationszeit habe man per Flugblatt üble Hetzkampagnen gestartet, heute versucht der IS Menschen über Websites zu radikalisieren.

"Der Datenhunger staatlicher Behörden ist groß: Im NSA-Datenzentrum in Utah stehen potentiell mehrere Terabyte an Datenvolumen für jeden Menschen auf der Welt bereit." Und was jetzt noch wirksam kodiert sei, könnte in ein paar Jahren eventuell problemlos gelesen werden. "Angreifer können verschlüsselte Daten jetzt speichern und später entschlüsseln. Die NSA geht so vor."

Angesichts solcher Entwicklungen sieht Wahlster ein wichtiges Ziel darin, dass Bürgerinnen und Bürger sich darum bemühen, die Datensouveränität zu erhalten. Der Stiftungsprofessor stellt Deutschland im Umgang mit Daten ein gutes Zeugnis aus. Auf der einen Seite freut er sich über eine ungewöhnlich wachsame Bevölkerung: "Ich finde es positiv, dass wir sehr kritisch sind. In Japan oder den USA ist das nicht so." Auf der anderen Seite sieht er einen Staat, der sich um den Rechtsschutz müht: "Das läuft eigentlich sehr gut", lobt Wahlster – kann sich jedoch einen letzten Zusatz nicht verkneifen: "Es könnte aber noch besser laufen."