DeepFake Soeder Seehofer

Artikel mit Bild-InhaltenBildbeitrag

Deep Fakes: Wie leicht lassen sich Videos manipulieren?

Kürzlich sorgte ein gefälschtes Obama-Video für Diskussionen im Netz. Die Befürchtung: Auch Videos kann man heute nicht mehr trauen. Doch wie leicht können Laien bewegte Bilder wirklich manipulieren? BR24 hat es ausprobiert. Von Christian Schiffer

Über dieses Thema berichtet: BR24 am .

Bei Fotos ist die Sache klar: Allerspätestens seitdem Josef Stalin Leo Trotzki aus allen Propaganda-Fotos wegretuschieren ließ, weiß so gut wie jeder, dass man auch Bildern nicht trauen kann. Mittlerweile sind manipulierte Bilder die Regel, für Plakatwände werden Model-Beine schlanker, für Instagram Urlaubshimmel blauer, für Tinder verschwinden Pickel und Falten. Bislang allerdings konnte man davon ausgehen, dass bewegte Bilder schwieriger zu manipulieren sind als Fotos, zumindest für Laien.    

Manipulation mittels Künstlicher Intelligenz

Seit einiger Zeit allerdings sorgen sogenannte Deep Fakes für Diskussionsstoff. So nennt man Videos, die mit Hilfe von künstlicher Intelligenz manipuliert werden. Vor einigen Wochen irritierten Deep-Fake-Videos die Öffentlichkeit, bei denen die Gesichter von prominenten Schauspielerinnen in Porno-Filmchen hineinmontiert wurden. Das Ganze gelang mit der Software "Fake App" die jeder umsonst im Netz herunterladen kann. Letzte Woche wiederum kursierte ein Obama-Video im Netz, in dem es so aussieht, als würde der Ex-US-Präsident seinen Nachfolger Donald Trump wüst beschimpfen. Auch dieses Video war zu großen Teilen mit Hilfe von Fake App erstellt worden. Obamas Stimme allerdings kam noch von einem Stimmen-Imitator aus Fleisch und Blut.

Photoshop für Stimmen

Doch auch auf die Stimme könnte bald schon nicht mehr Verlass sein. Bereits Ende 2016 hat Adobe mit Vovo eine Art Photoshop für die Stimme vorgestellt. Die Software benötigt eine Stimmprobe von etwa 20 Minuten und schon kann das Programm jeden Satz in dieser Stimme nachsprechen, allerding ist diese Software noch nicht frei verfügbar. Dasselbe gilt für eine Software des chinesischen Suchmaschinenkonzerns Baidoo, die angeblich nur eine Stimmprobe von 3,7 Sekunden benötigen soll, um einen Abdruck der Stimme erstellen zu können. Wer einen rudimentären Eindruck bekommen möchte, wie weit die Technik ist, kann "Lyrebird" ausprobieren. Diese Internetseite fordert den Nutzer, auf einige Worte einzusprechen, danach kann man mit dieser Stimme jeden Satz formen. Allerdings funktioniert das ganze nur auf Englisch, das Ergebnis klingt zudem sehr verrauscht und metallisch, Profi-Anwendungen wie die von Adobe sollen deutlich mehr können. 

Polit-Manipulation im Eigenbau

Aber kann ein durchschnittlicher Nutzer mit durchschnittlicher Hardware heute schon Videos im großen Stil manipulieren? Um das herauszufinden, haben wir uns die kostenlose Fake-App-Software heruntergeladen und versucht, ein relativ simples Face-Swap-Video zu machen, sprich: Die Gesichter von zwei Menschen zu vertauschen, in diesem Fall die Gesichter von Horst Seehofer und Markus Söder. Die Software lässt sich mit einigen wenigen Grundkenntnissen recht einfach bedienen. Sofern man genügend Ausgangsmaterial hat, beginnt die künstliche Intelligenz auf Knopfdruck selbstständig zu arbeiten. Insgesamt haben wir das Programm sieben Stunden lang auf einem etwas potenteren Laptop rechnen lassen, was eine eher kurze Zeitspanne für diesen Zweck ist. Das Ergebnis sehen Sie im Video, das unter diesem Artikel verlinkt ist.

Technologie birgt großes Missbrauchspotenzial

Horst Seehofer ist zwar noch als Horst Seehofer zu erkennen. Allerdings haben sich in seine Gesichtszüge deutlich erkennbar bereits phänotypische Spurenelemente von Markus Söder verirrt, auch wenn das Gesicht etwas verwaschen aussieht. Die Profis des Newsportals Buzzfeed, die das gefälschte Obama-Video produziert haben, hatten die Software 56 Stunden trainiert und das Video zudem nachbearbeitet, das Ergebnis sieht deswegen ungleich realistischer aus. Doch auch anhand unseres Video wird deutlich, wie weit die Technik momentan ist. Mit etwas mehr Zeit könnte auch jemand mit geringen Computerkenntnissen Herrn Seehofer deutlich mehr nach Herrn Söder aussehen lassen. Dass diese Technologie großes Missbrauchspotenzial mit sich bringt, liegt auf der Hand.