Die Welt als Datengemeinschaft

27.01.2021 von

Ein Team um Professor Dr. Carsten Binnig entwickelt eine vertrauenswürdige Plattform für „Data Sharing“. Damit eröffnen sich völlig neue Möglichkeiten, datenschutzkonform im Bereich Big Data und AI zu kooperieren.

Wenn ein Patient zum Arzt geht, möchte er nicht unbedingt die Daten, die dieser erhebt, mit Dritten teilen. Hat er allerdings eine schwere Erkrankung, würde er seine Patientendaten vielleicht doch gerne der medizinischen Forschung zur Verfügung stellen, was ihm aber aufgrund von Datenschutzregelungen nicht ohne Weiteres möglich ist. Der Konflikt zwischen Datenschutz und gemeinsamer Nutzung von Daten („Data Sharing“) betrifft nicht nur die Medizin: In der Industrie könnten geteilte Daten helfen, effizienter und damit günstiger, schneller sowie umweltfreundlicher zu produzieren. In der Politik helfen Daten, bessere Entscheidungen zu treffen, und in der Finanzwelt sind sie bei der Aufdeckung von Kreditkartenbetrug und Geldwäsche essenziell.

Dabei ist nicht der Datenschutz an sich das Problem, sondern eine fehlende technische Infrastruktur, die einen datenschutzkonformen Austausch erst möglich macht – und vor allem die Interessen aller Beteiligten wahrt. Und Daten gibt es reichlich: Die Menge der weltweit produzierten Daten soll auf voraussichtlich 175 Zettabyte im Jahr 2025 steigen. Allerdings gehen viele dieser Daten, obwohl sie für eine größere Gemeinschaft nützlich wären, verloren, weil die Unternehmen sie für sich behalten. Die EU möchte das Data Sharing erleichtern, aber dazu fehlen die notwendigen Technologien. An dieser Stelle setzten Forschende um Professor Carsten Binnig vom Data Management Lab der TU Darmstadt an. Sie entwickeln TrustDBle („trustable“ ausgesprochen) – eine neue Plattform, die einen vertrauenswürdigen und unkomplizierten Datenaustausch ermöglicht. Die Forschungen entstehen im Rahmen des Nationalen Forschungszentrums für angewandte Cybersicherheit ATHENE, einer Allianz der TU Darmstadt und der Hochschule Darmstadt sowie der Fraunhofer­Institute SIT und IGD. Es ist die europaweit größte Allianz von Forschungseinrichtungen im Bereich Cybersicherheit.

Der Bedarf an einer Technik wie TrustDBle ist groß. „Wir erleben derzeit einen Paradigmenwechsel in der Wirtschaft“, sagt Binnig. Bisher fokussierten sich die Unternehmen darauf, ihre Daten nur für sich zu nutzen. In der Automobilbranche bauten zum Beispiel Hersteller und Zulieferer ihre je eigenen Informationssysteme auf. Die Systeme sind zwar über Schnittstellen verbunden, aber sie können nicht gleichzeitig auf dieselben Informationen zugreifen. Daher muss jeder für sich auch einen eigenen Datenpool aufbauen, um damit etwa Geschäftsprozesse zu steuern oder verschiedene Modelle einer Künstlichen Intelligenz (KI) zu trainieren.

„Ich bin überzeugt, dass Data Sharing einen immensen Nutzen für Wirtschaft und Gesellschaft hat.“

„Inzwischen hat die Wirtschaft längst erkannt, dass es nützlicher ist, einen Teil der Daten zu teilen,“ sagt Binnig. „Damit kann man Business-Prozesse optimieren und transparenter gestalten, aber auch viele Anwendungsfälle im KI-Bereich, in dem viele Daten einfach noch fehlen, besser vorantreiben oder überhaupt erst ermöglichen.“ Aber warum ist es überhaupt so schwierig, die Daten zu teilen? „Es gibt dafür eine ganze Reihe von Herausforderungen“, sagt der Darmstädter Forscher. „Zum einen gibt es eine Vielzahl von Gesetzen, zum Beispiel die Datenschutz­Grundverordnung der EU, die besagen, wie man mit Daten umgehen muss. Hinzu kommen die firmeninternen Regularien, also Policies, die ebenfalls regeln, welche Daten mit wem und wo geteilt werden dürfen.“

Ein anschauliches Beispiel ist ein Krankenhaus: Es kann zwar Daten über Patienten sammeln, aber insgesamt sind das sehr kleine Datenmengen, die nicht ausreichen, um KI­Modelle zu trainieren. Eine KI braucht in der Regel viele Beispieldaten, um Muster zuverlässig zu lernen. Um zum Beispiel einen Hautkrebs auf Aufnahmen zu erkennen, muss die KI idealerweise Hunderttausende oder besser noch Millionen Aufnahmen haben, auf denen sowohl Hautkrebs als auch gesunde Haut zu sehen sind – nur so kann sich die KI eine zuverlässige Unterscheidung selbst beibringen.

Weiterlesen: hoch3 FORSCHEN, 4/2020

Aktuelle Veröffentlichungen zum Thema

  • El-Hindi, Muhammad; Karrer, Simon; Doci, Gloria; Binnig, Carsten: TrustD-Ble: Towards Trustable Shared Databases. In: FAB 2020.
  • El-Hindi, Muhammad; Heyden, Martin; Binnig, Carsten; Ramamurthy, Ravi; Arasu, Arvind; Kossmann: BlockchainDB – Towards a Shared Database on Blockchains. In: SIGMOD 2019.
  • El-Hindi, Muhammad; Binnig, Carsten; Arasu, Arvind; Kossmann, Donald; Ramamurthy, Ravi: BlockchainDB – A Shared Database on Blockchains. In: PVLDB 2019.

Hintergrund

Die Informatik-Professoren Carsten Binnig und Sebastian Faust leiten die Mission TRUDATA am Nationalen Forschungszentrum für angewandte Cybersicherheit ATHENE. Ziel ist die Entwicklung neuer Technologien, die einen vertrauenswürdigen, verlässlichen und selbstbestimmten Datenaustausch ermöglichen und für viele Anwendungen in Bereichen wie Gesundheit, Produktion oder Finanzen relevant sind.