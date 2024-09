Wer schon einmal mit ChatGPT & Co. gearbeitet hat, kennt das Problem: Die KI erzählt im Brustton vollster Überzeugung totalen Quatsch. Da ist zum Beispiel die Rezepte-KI, die ein Rezept für ein Erfrischungsgetränk ausspuckte, das sich nach der Zubereitung allerdings als giftiges Chlorgas entpuppt hätte. Oder das Biologie-Papier, das wissenschaftlich aussehende Bilder von Mäusen enthielt, die sich aber bei genauer Betrachtung als KI-generierte Quatsch-Bilder herausstellten. Unvergessen auch die Empfehlung der Google KI Gemini, mindestens einen Stein am Tag zu essen, um den Mineralien-Haushalt des menschlichen Körpers im Gleichgewicht zu halten. Besonders bekannt auch das "Strawberry"-Problem. ChatGPT kann allerlei Wunderdinge vollbringen, aber ist nicht in der Lage die korrekte Anzahl des Buchstaben "r" in dem Wort "Strawberry" zu berechnen.

KI soll Fehler vermeiden

Der zugrundeliegende Mechanismus dieser Phänomene ist das, was in der KI-Entwicklung als "Reinforcement Learning by Human Feedback" (RLHF) bezeichnet wird. Hierbei wird das KI-Modell mit statistischen Korrelationen zwischen Wortgruppen und Bedeutungskategorien gefüttert, was zu Texten führt, die auf den ersten Blick täuschend echt erscheinen können. KIs lernen auf der Basis großer Textmengen Zusammenhänge herzustellen und nutzen statistische Wahrscheinlichkeiten, um Vorhersagen darüber zu treffen, was als Nächstes kommt. Die KI "weiß" also nicht, was wahr ist und was nicht – sie kennt nur Muster und Wahrscheinlichkeiten.

o1 lässt sich Zeit – und macht weniger Fehler

Nun hat OpenAI, die Firma hinter ChatGPT, ein neues KI-Modell vorgestellt. Es trägt den etwas nichtssagenden Namen o1 und soll in logischem Denken, Mathematik und Programmieren deutlich besser sein als das Modell 4o. Allerdings lässt o1 mehr Zeit für seine Antworten, das aber aus guten Gründen: Die Grübel-KI überprüft seine Antworten, weil es Techniken des "verstärkten" Lernens benutzt. Dieser Ansatz zielt darauf ab, das System so zu trainieren, das den menschlichen Problemlösungsprozess nachahmt. Oder wie OpenAI in einem Blogbeitrag schreibt: Die KI verbringe Zeit mit nachdenken, "so wie eine Person es machen würde".

OpenAI gibt an, dass die neue Trainingsmethode zu einer verbesserten Genauigkeit und höherer Zuverlässigkeit führe. Einen Befund, den Gregor Schmalzried, Host von "Der KI-Podcast", in einem ersten kurzen Test bestätigt.

Zugang erst einmal nur für Bezahl-Kunden

Auf der anderen Seite kann o1 keine Bilder generieren und auch nicht das Internet durchsuchen. Das neue Modell steht ab sofort allen Nutzern von ChatGPT Plus- und Team-Abonnenten genutzt werden, während Gratis-User später Zugang bekommen sollen.

Über dieses Thema berichtet "Der KI Podcast" am 17.2.2024