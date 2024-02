Im Netz sorgt das für Aufruhr. "Es ist schier unmöglich, mit Google Gemini eine weiße Person zu generieren", kommentiert etwa ein X-Nutzer, andere sprechen von Diskriminierung. Manche fragen auch, ob hinter diesen Bildern eine bewusste Strategie steckt.

Die Diskussion wird noch zusätzlich dadurch erhitzt, dass einige der viralen Bilder auch politisch fragwürdig sind. Ein viraler Screenshot zeigt, dass Google Gemini angeblich sogar Wehrmachtssoldaten als asiatische Frauen darstellt.

Googles KI schärft Nutzerprompts nach

Ein Test von BR24 bestätigt: Ja, Google Geminis Bildgenerator meint es mit der Vielfalt durchaus ernst. Fast immer generiert die KI Menschen verschiedener Herkünfte und Hautfarben. Wie repräsentativ diese für einen historischen Schauplatz sind, spielt dabei kaum eine Rolle.

Ein Blick in den Arbeitsprozess der KI zeigt: Tatsächlich werden die Prompts, also die Anfragen des Nutzers, von der KI weiter bearbeitet und umgeschrieben. Das ist erstmal nichts Ungewöhnliches, sondern für eine Text-zu-Bild-KI ein ganz normaler Arbeitsschritt. So soll zum Beispiel sichergestellt werden, dass sich die abgebildeten Bilder nicht zu ähnlich sehen und der Nutzer eine breite Auswahl an Bildern vorgeschlagen bekommt.

Bei dieser Bearbeitung des Prompts werden an vielen Stellen auch Hautfarbe und Herkunft der Personen spezifiziert. So macht die KI etwa aus dem Prompt "Ein Paar im Deutschland der 1820er Jahre" den neuen Prompt "Ein detailliertes Gemälde einer amerikanischen Ureinwohnerin in einem fließenden Kleid und ein weißer Mann im Frack, die bei einem Ball in einem deutschen Schloss tanzen." Nach diesem Prompt wird dann das Bild generiert und bereitgestellt.

Ein leicht anderer Prompt ändert alles

Das bedeutet aber auch, dass nur eine leichte Veränderung des ursprünglichen Prompts die Ergebnisse beträchtlich verändern kann. Zum Beispiel, indem man nicht nach einem "Paar im Deutschland der 1820er" fragt, sondern nach einem "deutschen Paar in den 1820ern". Wendet man den letzteren Prompt an, sehen die abgebildeten Personen fast ausschließlich mitteleuropäisch aus. Bei den viralen Bildern könnte es sich also um eine Art "Missverständnis" handeln: Die KI interpretiert möglicherweise den Zusatz "Deutschland der 1820er" lediglich als Schauplatz und bezieht ihn nicht auf die abgebildeten Personen.