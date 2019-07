Natürlich braucht ein Sprachassistent Futter in Form von Sprachdaten, um besser zu werden. Amazon speichert für das Sprachassistenzsystem "Alexa" und sein darauf basierendes Gerät "Amazon Echo" aufgezeichnete Audio-Files und Transkripte davon und analysiert sie. Allerdings wollen Nutzer auch wissen, was mit ihren Sprachdaten wirklich passiert und welche Kontrolle sie darüber haben.

Der amerikanische Senator Chris Coons fühlt Amazon bei diesem Thema schon länger auf den Zahn und hat vom US-Konzern nun eine ausführliche Antwort erhalten, was mit den Sprachaufnahmen eigentlich passiert. Wir haben uns die wichtigsten Fragen und Antworten angesehen:

Für was braucht Amazon eigentlich Transkripte der Aufnahmen?

Kurz zusammengefasst sagt Amazon: Sprachassistenz-Systeme müssen ständig lernen, um echte, gesprochene Sprache in unterschiedlichen Situation verstehen zu können. Unternehmen wie Amazon machen sich maschinelles Lernen zunutze, um ihre Systeme zu trainieren. Transkripte von Sprachaufnahmen können dabei helfen, häufige Fehler und Schwächen des Systems aufzudecken.

Wie lange speichert Amazon Transkripte der Sprachaufnahmen?

Amazon gibt an, dass Sprachaufnahmen und Transkripte solange gespeichert werden, bis der Nutzer sich dazu entschließt, diese zu löschen. Automatisch wird also gar nichts gelöscht.

Können Nutzer wirklich alles löschen?

Nein. Zwar kann der Nutzer alle seine Sprachaufnahmen und damit verbundene Transkripte aus Alexas "Primärsystem" löschen, aber nicht aus allen untergeordneten Systemen. Einige Transkripte könnten dort noch vorhanden sein. Amazon möchte dies aber ändern und beschreibt seine Bemühungen, die Transkripte überall löschen zu können, als "ongoing". Das Unternehmen lässt zumindest die Absicht erkennen, da nachzubessern.

Amazon gibt allerdings auch an, dass in einigen Fällen die Daten nicht gelöscht werden könnten:

"Wenn ein Kunde etwa Amazon Music abonniert, bei Amazon Fresh bestellt, sich ein Uber- oder Lyft-Taxi ruft, oder eine Pizza bestellt. [...] Selbstverständlich braucht Amazon und/oder der Skill-Entwickler einen Beleg dafür." - Brian Huseman, Amazon

Aber auch wenn Nutzer über Alexa ihren Wecker stellen, Kalendereinträge machen, oder Freunden Nachrichten schicken, löscht Amazon diese Daten nicht.

Werden die Transkripte anonymisiert?

Nein. Amazon erklärt:

"Wir ermöglichen unseren Kunden, dass sie über die "Dialogverlauf"-Option die eigenen Sprachaufnahmen und Transkripte einsehen können. Deshalb müssen diese mit dem Account verknüpft sein." - Brian Huseman, Amazon

Was geschieht mit Sprachdaten bei der Aktivierung von Alexa genau?

Sprachassistenten wie Alexa oder Siri springen, zumindest in der Standard-Einstellung, auf ein Signalwort an. Sie müssen also mithören, wann dieses Signalwort zur Aktivierung fällt, bevor überhaupt eine Interaktion stattfinden kann. Da ist zunächst die Frage naheliegend, ob Alexa permanent mithört - Antwort: ja.

Interessanter ist aber die Frage: Speichert Amazon die Daueraufnahme auch und wertet sie aus?

Hier ist die Antwort Amazons etwas ausführlicher: Das System unterscheidet zwischen Spracherkennung für die Interaktion, also wenn Alexa zum Beispiel eine Frage oder Aufgabe vom Nutzer gestellt wird - und Erkennung des Signalwortes, wobei laut Amazon nur der akustische Klang des Signalworts erkannt wird, ohne das Spracherkennungssystem.

Nicht alles wandert in die Cloud

Es gibt quasi zwei unterschiedliche Kreisläufe: Bis das Signalwort gefallen ist, wird ein kleiner Puffer im ersten Kreislauf permanent überschrieben. Hier findet keine Speicherung und Spracherkennung statt - keine Daten werden in Amazons Cloud geschickt. Der zweite Kreislauf springt an, sobald das Signalwort erkannt wurde. Dann wird die folgende Interaktion durch Amazons Spracherkennung in der Cloud gejagt und ausgewertet. Dieser Stream endet, wenn der Nutzer die Interaktion beendet, Alexa Stille oder Sprache erkennt, die nicht an die Sprachassistentin gerichtet ist. Ob das in der Praxis so reibungslos funktioniert, kann man freilich nur mutmaßen.

Offene Fragen

Der US-Senator Coons, der die Anfrage gestellt hatte, zeigte sich zwar einigermaßen zufrieden mit den Antworten Amazons, jedoch sieht er noch große Unklarheit, was die Weitergabe von Daten an Entwickler und Dritte betrifft:

"In welchem Ausmaß Daten mit Dritten geteilt werden, und wie diese die Daten verwenden und kontrollieren, ist immer noch nicht klar. Amerikaner haben es verdient zu erfahren, wie Tech-Unternehmen mit ihren persönlichen Daten umgehen." - Chris Coons, US-Senator