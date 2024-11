Nun kann man also auch in Europa mit ChatGPT plaudern, in den USA gibt es den sogenannten "Voice Mode" schon seit ein paar Wochen. Bislang war die Kommunikation mit Maschinen unter Zuhilfenahme der menschlichen Stimme ja immer recht holprig. Amazons Alexa beispielsweise verstand einen oft nicht und reagierte nur auf bestimmte Befehle. Doch jetzt kann man mit Maschinen sprechen, wie mit Menschen – und sie sogar unterbrechen.

Halbwegs natürliche Kommunikation mit Maschinen

In Tests des ARD-KI-Podcasts zeigte sich: Die KI atmet zwischen den Sätzen, lacht bei lustigen Bemerkungen und passt ihre Stimmlage der Situation an. Technisch basiert das System auf einem sogenannten multimodalen Ansatz. Anders als frühere Sprachausgaben, die Text erst in gesprochene Sprache umwandeln mussten, wurde ChatGPTs neues Voice-Feature direkt mit Audiodaten trainiert. Das ermöglicht eine deutlich natürlichere Kommunikation.

"Das hört sich für mich nicht bairisch an"

Doch was passiert, wenn man mit ChatGPT nicht auf schnödem Hochdeutsch parliert, sondern in der schönsten Sprache der Welt, dem Bairischen? Wird die KI das Bairische mit all seinen Diphthongen, den typisch weichen Konsonanten und dem unverkennbaren Rhythmus verstehen – und sprechen können?

Gerald Huber, der Bairisch-Experte des Bayerischen Rundfunk probiert es aus, wechselt ein paar Sätze auf Bairisch mit der Maschine und wird gegenüber ChatGPT sehr deutlich: "Das hört sich für mich überhaupt nicht bairisch an, was Du da sagst."

Warum scheitert die KI?

Tatsächlich spricht ChatGPT schlechter bairisch als ein Preuße beim ersten Stammtisch-Besuch des Trachtenvereins Rottal-Inn. Man merkt, so richtig viel Bairisch dürfte in den Trainingsdaten von ChatGPT nicht enthalten sein – wenn überhaupt. Die KI spricht bairisch, als würde sie als Zuagroaster einen bairischen Text vortragen. Das erklärt auch, warum sich die KI so schwertut, einen Diphthong zu sprechen.

Mannheim statt Mallersdorf

Und es kommt noch schlimmer, denn die KI gleitet immer wieder ins Badische ab. Anstatt kernig-bairisch spricht die KI in einem lätscherten Singsang daher, das man eher aus Mannheim kennt und nicht aus Mallersdorf. Und so bleibt zum Schluss eine beruhigende Erkenntnis: Zumindest die bairische Sprache bleibt bis auf Weiteres eine Domäne der Menschen und nicht der Maschinen.