Alexa, Siri und Co: Sprachtechnologen wollen Datenschutz beim Dialog mit Computer verbessern
Sprachdialogsysteme wie Alexa und Siri sind inzwischen große Hilfen zum Beispiel bei der Musik- und Filmauswahl, der Internetrecherche oder der Steuerung von „Smart Homes“. Die Daten allerdings, also die Sprachbefehle und Dialoge der Nutzer, werden auf Servern dieser Firmen langfristig gespeichert, was vielen Benutzern Unbehagen bereitet. Saarbrücker Sprachtechnologen möchten nun im Verbund mit französischen, spanischen, deutschen und lettischen Kollegen ein Sprachdialogsystem entwickeln, das sowohl von der Qualität her an die großen Marktführer heranreicht, aber die Daten auch so verarbeitet, dass die Privatsphäre des Nutzers immer gewahrt bleibt. Das COMPRISE-Projekt (Cost-effective, Multilingual, Privacy-driven voice-enabled Services) wird im Rahmen des Horizon-2020-Programms der Europäischen Union mit 3,2 Millionen Euro über drei Jahre gefördert. 600.000 davon fließen an die Universität des Saarlandes.
Sie erleichtern unseren Alltag, hinterlassen aber gleichzeitig bei vielen Nutzern ein mulmiges Gefühl: Sprachdialogsysteme wie Apples Siri oder Amazons Alexa. Inzwischen sind die Kinderkrankheiten beseitigt, und die Systeme funktionieren erstaunlich gut im Alltag. Allerdings landen die Daten der Nutzer, also auch ihre Sprachbefehle und Anfragen, auf Servern der Anbieter. Was damit geschieht, ist nicht klar. Diese Unsicherheit ist häufiger Kritikpunkt beim Umgang mit den praktischen Helfern.
Maschinelles Lernen braucht allerdings eine riesige Datenmenge, um gut zu funktionieren. Je mehr Daten, desto besser wird das System“, gibt Thomas Kleinbauer zu bedenken. Der Wissenschaftler forscht am Lehrstuhl für Sprach- und Signalverarbeitung bei Professor Dietrich Klakow, der mit seinem Team einen sprachtechnologischen Teil des COMPRISE-Projekts übernimmt. Es ist per se also nicht verwunderlich, dass die großen IT-Unternehmen aus den USA so viele Daten sammeln, wie sie können. Aus technischer Sicht ist es vielmehr sinnvoll, alle diese Daten zu speichern und zu verarbeiten.
„Aber wir wissen natürlich nicht, was in letzter Konsequenz mit den Daten geschieht“, sagt Thomas Kleinbauer. Unter den gespeicherten Daten könnten sich ja auch kritische Dinge befinden, nicht nur Musiktitel oder die Suche nach der neuen Jeans: „Will man beispielsweise die Kreditkartennummer oder seine Patientendaten, die ein Arzt per Sprachassistent in sein Computersystem eingegeben hat, dort gespeichert haben?“
Die Saarbrücker Sprachtechnologen suchen im COMPRISE-Projekt also nach Wegen, ein Sprachdialogsystem zu entwickeln, das zum einen hohe Datenschutzauflagen erfüllt und zum anderen auch die sehr gute Nutzwertigkeit der großen kommerziellen Systeme aufweist. Die Forscher haben dabei viele Punkte im Blick: „Kritische Informationen könnten beispielsweise ausgeblendet oder geändert werden, eine Stimme kann verfremdet werden, bevor sie auf einem Server gespeichert wird“, nennt Professor Klakow einige Beispiele. Das Maschinelle Lernen würde mit solchen anonymisierten Daten aber ebenso funktionieren. „Die Daten an sich blieben nutzbar“, erklärt Klakow. „Gleichzeitig aber wären weniger private Daten auf Servern gespeichert, die außerhalb der Reichweite der Nutzer stehen.“
Am Ende der dreijährigen Forschung wollen die Wissenschaftler mehrere Demonstratoren, zum Beispiel für die Bereiche E-Commerce und E-Health, entwickelt haben, welche die Technologie im kleinen Maßstab vorführen kann.
Federführend im COMPRISE-Projekt (Cost-effective, Multilingual, Privacy-driven voice-enabled Services) ist das nationale französische Institut für Informatik und angewandte Mathematik INRIA (www.inria.fr). Neben der Universität des Saarlandes sind außerdem folgende Partner an COMPRISE beteiligt: Netfective Technology SA (Frankreich, www.bluage.com), Ascora GmbH (Deutschland, https://ascora.net), TILDE SIA (Lettland, www.tilde.com), Rooter Analysis SL (Spanien, www.rooter.es).
Weitere Informationen auf der Projektwebseite https://project.inria.fr/comprise/.
Twitter: https://twitter.com/compriseh2020
LinkedIn: https://www.linkedin.com/company/comprise-h2020
Kontakt:
Prof. Dr. Dietrich Klakow
Tel.: (0681) 30258122
Dietrich.Klakow(at)lsv.uni-saarland.de
Dr. Thomas Kleinbauer
Tel.: (0681) 30258130
E-Mail: thomas.kleinbauer(at)lsv.uni-saarland.de