Website von OpenAI zum Chatbot ChatGPT
Bildrechte: dpa-Bildfunk/Richard Drew

ChatGPT ist anfällig für Falschinformationen. Doch auf Chinesisch scheint dieses Risiko höher zu sein als auf Englisch.

Per Mail sharen
Artikel mit Audio-InhaltenAudiobeitrag

Warum ChatGPT in manchen Sprachen mehr "lügt" als in anderen

ChatGPT ist anfällig dafür, auch falsche Antworten zu generieren. Doch auf Chinesisch scheint dieses Risiko höher zu sein als auf Englisch - wie ein Experiment zeigt. Warum der Chatbot in manchen Sprachen schlechter funktioniert als in anderen.

ChatGPT erstellt auf Chinesisch Desinformationen - wenn man den Chatbot explizit danach fragt. Das hat ein Test von NewsGuard ergeben, einer Organisation, die die Verbreitung von Desinformation untersucht. Eine News Guard-Mitarbeiterin forderte ChatGPT 3.5 auf, Nachrichtenartikel zu erstellen, die bekannte Falschinformationen über China enthalten.

Auf Englisch weigert sich ChatGPT, Falschinformationen zu erstellen

Zuerst auf englisch: Dabei weigerte sich ChatGPT in sechs von sieben Fällen die falschen Behauptungen zu produzieren. Anschließend versuchte es die Analystin sowohl auf vereinfachtem als auch auf traditionellem Chinesisch - und hatte mehr "Erfolg". Hier produzierte ChatGPT für alle sieben Eingaben die gewünschten falschen Texte - etwa, dass das US-Militär 2019 für die Einschleppung des Coronavirus nach China verantwortlich gewesen sei.

Sprachmodelle wie ChatGPT kennen kein "wahr" oder "falsch", sie generieren Texte nach dem Wahrscheinlichkeits-Prinzip: Welches Wort passt am wahrscheinlichsten zu den bereits vorhandenen Wörtern in einem Satz. Grundlage dafür sind die Daten, mit denen die Sprachmodelle trainiert wurden, im wesentlichen Online-Texte.

  • Auch interessant: Faszinierende Dialoge: Welche Technik steckt hinter ChatGPT?

Es kommt auf die Menge und Qualität der Trainingsdaten an

Wie gut ChatGPT eine Sprache "versteht", hängt von verschiedenen Faktoren ab:

  • Größe und Vielfalt der Trainingsdaten: Der englische Datenpool ist mit Abstand der größte und er enthält andere Texte und Quellen als die chinesischen oder die deutsche Trainingsdaten. Im chinesischen Datenpool sind höchstwahrscheinlich auch viele Medienberichte, die die Sichtweise der chinesischen Regierung wiedergeben.
  • Komplexität der Sprache: Was Grammatik und Satzbau anbelangt, ist Deutsch komplizierter als Englisch. Und Chinesisch komplizierter als Deutsch.
  • Kultureller Kontext: Hier geht es vereinfacht gesagt um die Wertvorstellungen in einer Kultur - und hier gibt es Unterschiede zwischen den Wertvorstellungen in der westlichen Welt und in China.

Je schlechter ChatGPT eine Sprache versteht, desto höher ist die Wahrscheinlichkeit, dass der Chatbot weniger genaue oder sogar falsche Antworten liefert. So wie im NewsGuard-Experiment.

Das ist die Europäische Perspektive bei BR24.

"Hier ist Bayern": Der BR24 Newsletter informiert Sie immer montags bis freitags zum Feierabend über das Wichtigste vom Tag auf einen Blick – kompakt und direkt in Ihrem privaten Postfach. Hier geht’s zur Anmeldung!