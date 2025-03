Friedrich Merz, Angela Merkel und Olaf Scholz fahren grinsend auf Hoverboards durch eine menschenleere Fußgängerzone. Was aussieht wie das Titelbild einer Satirezeitschrift, ist in Wahrheit das Ergebnis eines simplen Prompts in ChatGPT. Möglich macht das die neue Bildfunktion des KI-Systems, die mit erstaunlicher Leichtigkeit Bilder generiert, für die man früher Talent, Zeit – oder zumindest Photoshop gebraucht hätte.

Bilder per Befehl: Die neue Funktion von ChatGPT

OpenAI hat seiner KI ein umfassendes Upgrade verpasst. Statt auf DALL-E 3 basiert die Bildgenerierung nun auf dem neuen multimodalen Modell GPT-4o – mit spürbaren Fortschritten bei Texttreue, Bildkonsistenz und Bearbeitungsmöglichkeiten. Das Ergebnis ist eine überraschend leistungsfähige und niederschwellig bedienbare Alternative zu klassischer Bildbearbeitung.

Für alle, die jemals an den Menüs von Photoshop verzweifelt oder sich mit Ebenenmasken herumgeschlagen haben: GPT-4o braucht keine Vorkenntnisse. Statt Werkzeugkasten genügt eine einfache Anweisung wie: "Merkel ein Stirnband verpassen", "Merz gegen Lindner austauschen" oder "Mach daraus eine Retro-Werbeanzeige im Stil der 80er". Die KI versteht, was gemeint ist – und setzt es oft verblüffend gut um.

Endlich Klartext: GPT-4o schreibt lesbare Buchstaben

Ein besonders sichtbarer Fortschritt: GPT-4o kann endlich lesbaren Text in Bilder integrieren. Während frühere Modelle meist nur krakelige "Hieroglyphen" erzeugten, erscheinen nun klar erkennbare Wörter auf Straßenschildern, T-Shirts oder Notizzetteln. Das macht das Tool besonders nützlich für die Erstellung von Infografiken, Logos oder Social-Media-Grafiken.

Ein Modell, das spricht – und versteht, was gemeint ist

Auch die Bildbearbeitung selbst wurde deutlich verbessert. Anders als bisher, wo jede Veränderung ein komplett neues Bild erzeugte, bleibt GPT-4o bei Modifikationen konsistent. Einzelne Elemente lassen sich gezielt bearbeiten, ohne dass der Rest der Szene verloren geht. Wer Merz, Merkel und Scholz lieber auf Skateboards statt Hoverboards sehen will – kein Problem. Die KI tauscht nur das Nötige aus. Und wer möchte, kann sogar noch weiter gehen – in die Parallelwelt der Popkultur zum Beispiel.