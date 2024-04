Der Hype um generative KI ist eng mit einer Firma verknüpft: OpenAI steckt nicht nur hinter ChatGPT, sondern auch hinter anderen Wunder-KIs wie dem Bildgenerator DallE und dem Filmgenerator Sora. Nun hat die Firma ein neues Tool vorgestellt: Voice Engine kann Stimmen klonen und benötigt dafür nur eine 15-sekündige Aufnahme des Originals.

Großes Potenzial...

OpenAI sieht eine Menge Potenzial für die Anwendung. Menschen, die aus irgendwelchen Gründen nicht sprechen können, etwa wegen einer Sprachstörung oder einer Krankheit, könnten sich bald mit einer KI-Stimme Gehör verschaffen. Podcasts und Hörbücher könnten in verschiedene Sprachen übersetzt werden. Kinder könnten mithilfe von KI-Stimmen leichter Lesen lernen.

... und große Gefahren

Aber klar ist auch, dass die Technologie zum Missbrauch einlädt – und OpenAI weiß das. Denn schon heute gibt es KI-Tools, um eine Stimme zu klonen und Fälle, in denen Kriminelle versucht haben, mittels KI-Stimmen Betrugsmaschen durchzuziehen. Stimmklone könnten zudem auch gravierende Auswirkungen auf westliche Demokratien haben. In der Slowakei sorgte im Februar eine gefakte Audioaufnahme zwei Tage vor der Präsidentschaftswahl für Unruhe. Ähnliches passierte bei der Vorwahl der US-Demokraten in New Hampshire. Ein Audiofake von Präsident Joe Biden machte die Runde mit dem Aufruf, besser nicht zur Wahl zu gehen und sich seine Stimme stattdessen für Präsidentschaftswahl im November aufzuheben.

Auch wegen solcher Risiken hat OpenAI strenge Nutzungsrichtlinien eingeführt, die den Missbrauch verhindern sollen, indem sie unter anderem die ausdrückliche Zustimmung der Originalsprecher verlangen. Vor allem aber macht die Firma das Tool, das bereits Ende 2022 entwickelt wurde, nur ausgewählten Zielgruppen zugänglich.

Voice Craft: Offen für Alle

Anders sieht das aus bei Voice Craft, einem Open-Source-Programm, das gerade erst erschienen ist. Voice Craft braucht nur drei Sekunden Original-Material, um einen KI-Stimmklon zu erstellen. Den Machern hinter Voice Craft ist ebenfalls bewusst, dass ihre Technologie auch für fragwürdige Dinge eingesetzt werden kann. Doch gerade deswegen haben sie das Tool für die Öffentlichkeit freigegeben. Mit der Veröffentlichung des Modells wolle man anderen die Möglichkeit geben, über Gegenstrategien nachzudenken.

Das erinnert an die Strategie von Stable Diffusion, ein Bild-Generator, der ebenfalls als Open Source verfügbar gemacht wurde. Das ermöglicht es Forschern, Entwicklern und der breiten Öffentlichkeit, die Technologie zu verstehen, zu nutzen, zu verbessern – und möglicherweise Gegenmaßnahmen zu entwickeln, wenn es um den Missbrauch solcher Systeme geht. Beispiele für solche Ideen könnten die Entwicklung von Software zur Erkennung von KI- Inhalten sein oder die Schaffung von Wasserzeichen, um KI-Fakes eindeutig als solche zu kennzeichnen.

Marco Buschmann fordert Kennzeichnung von KI-Fakes

Auch die Politik beschäftigt sich mit der Frage, wie man der Flut an KI-Fakes Herr werden kann. Kürzliche hatte Bundesjustizminister Marco Buschmann (FDP) eine Kennzeichnungspflicht für Bilder gefordert, die mit künstlicher Intelligenz geschaffen wurden. Die Effektivität einer solchen Maßnahme wird von Experten allerdings bezweifelt. Auch das zeigt: Die Diskussion, was den Umgang mit KI-generierten Inhalten angeht, steht noch ganz am Anfang.