Im Internet Benutzerdaten erheben, ohne die Privatsphäre zu gefährden

Bild der Pressemitteilung


„Daten sammeln können sehr viele, aber wenigen gelingt es, dabei nicht die Privatsphäre zu gefährden“, erklärt Aniket Kate, der am Saarbrücker Exzellenzcluster „Multimodal Computing and Interaction“ die Gruppe „Cryptographic Systems“ leitet. Zwei Aspekte seien besonders problematisch. Zum einen, wo diese Daten erhoben werden und wie man sie zusammenführt. Die Betreiber von Webseiten interessiere beispielsweise, welche Altersgruppen ihr Angebot nutzen. Dazu installieren sie Dateien (Cookies) auf den Rechnern der Kunden, die abspeichern, welche Internet-Seiten diese sonst noch besuchen. „Die so gewonnenen Informationen erlauben ihnen jedoch auch, detaillierte Profile für jeden einzelnen zu erstellen“, sagt Kate. Außerdem sei die Veröffentlichung der erhobenen Daten problematisch. „Wissenschaftler haben nachgewiesen, dass man über den Stromverbrauch, der von intelligenten Stromzählern erfasst wird, die Gewohnheiten der einzelnen Kunden ausspionieren kann“, so Kate.

Zusammen mit seinen Kollegen Fabienne Eigner und Matteo Maffei vom Saarbrücker Center for IT-Security, Privacy and Accountability (CISPA) sowie Francesca Pampaloni vom italienischen IMT Institute for Advanced Studies Lucca, hat Kate daher ein Softwaresystem namens Privada entwickelt. Es löst nicht nur das Dilemma zwischen Informationswunsch und Datenschutz auf, sondern kann auch mühelos in verschiedenen Szenarien angewendet werden. „Webseiten-Betreiber können zwar immer noch herausfinden, dass ihre Seiten überwiegend von Frauen mittleren Alters besucht werden, mehr aber auch nicht“, erklärt Kate die Grundidee.

Dazu spalten die auf ihre Privatsphäre bedachten Anwender die angefragte Information auf und senden jeweils einen Teil davon an vorab definierte Server. Gemäß dem Konzept des „Multi-party computation“ wertet jeder Server die Daten aus, ohne von den anderen Daten zu wissen. Auf diese Weise berechnen sie zusammen ein Geheimnis, können es aber nicht im Alleingang lüften. Zusätzlich rechnet jede Partei noch einen Wert entsprechend einer Wahrscheinlichkeitsverteilung hinzu, um etwas Unschärfe hereinzubringen. Diese leicht verfälschten Teilergebnisse werden dann zur eigentlichen Auswertung zusammensetzt. Die Verfälschung sorgt dafür, dass die Identität des Einzelnen geschützt, die Tendenz des Gesamtresultats aber noch erkennbar ist.

Die Privatsphäre ist selbst dann gesichert, wenn alle bis auf einen Server zusammenarbeiten. Daher sei es sogar denkbar, dass solche Server von Unternehmen wie Google gestellt würden, so die Forscher. Dass die Server und nicht die Anwender selbst ihre Informationen verfälschen, hat zwei Vorteile: Die Rechenleistung auf Anwenderseite muss nicht hoch sein. Um das Teilergebnis an den jeweiligen Server zu schicken, reicht sogar ein Mobiltelefon aus. Außerdem ist die zum Gesamtergebnis hinzugerechnete Verfälschung minimal und die resultierende Nutzerstatistik so präzise wie möglich.

Die Saarbrücker Forscher haben dieses Konzept bereits in einer Software umgesetzt. „Die Berechnung ist schnell, die Server benötigen nur einige Sekunden“, sagt Fabienne Eigner aus der Gruppe „Secure and Privacy-preserving Systems“ an der Universität des Saarlandes. Sie hat ebenfalls an dem Softwaresystem mitgearbeitet. Aufgrund der Architektur, so Eigner, es praktisch keinen Unterschied, ob man die Daten von 1000 oder 1.000.000 Personen auswerte.

Weitere Fragen beantworten

Prof. Matteo Maffei
Secure and Privacy-preserving Systems Group, Saarland University
+49 681 302-70780
E-Mail

Aniket Kate
Exzellenzcluster „Multimodal Computing and Interaction“, Universität des Saarlandes
E-Mail