KI-generierte Kunst aus dem Programm Midjourney
Bildrechte: Midjourney

KI-generierte Kunst aus dem Programm Midjourney

    Text-zu-Bild-Generatoren revolutionieren das Internet

    Eine Zukunftsvision ist Realität geworden: Programme, die mithilfe Künstlicher Intelligenz aus Text-Eingaben Bilder generieren, stehen seit Kurzem zur freien Verfügung. Sie könnten eine der größten technologischen Neuerungen überhaupt darstellen.

    Es klingt wie technische Zauberei. Man gibt eine völlig absurde Formulierung ein — beispielsweise "Porträt eines Allosaurus in der Kleidung eines Händlers in den 1500er Jahren, im Stil von Rembrandt" und erhält eine Auswahl von Bildern, die genau das zeigt... Auch wenn man die erste Person war, die jemals diesen Gedanken hatte.

    Möglich machen das Programme wie DALL-E, Midjourney und Stable Diffusion: Bild-Generatoren, die mit Künstlicher Intelligenz Grafiken generieren können sind seit Kurzem überall. Die Programme waren jahrelang unter Ausschluss der Öffentlichkeit entwickelt und trainiert worden — doch die Zeit der Geheimniskrämerei ist vorbei. Und nun zeigt sich: Diese technologische Neuheit hat das Potential, das Internet grundlegend zu verändern.

    Wie funktionieren DALL-E, Midjourney und Co?

    Auch wenn es verschiedene Anbieter gibt: Das Prinzip dahinter ist immer das Gleiche. Die Programme werden mit unzähligen beschrifteten Bildern gefüttert, welche dann automatisch analysiert werden. Die künstliche Intelligenz funktioniert hierbei ähnlich wie ein menschliches Kind, das beim Aufwachsen immer wieder ein Bild von einem Otter gezeigt und erklärt bekommt, dass dieses Tier "Otter" heißt. Irgendwann stellt die künstliche Intelligenz die Verbindung zwischen dem Aussehen eines Otters und dem Wort "Otter" her, und ist in der Lage, auf Anfrage einen darzustellen.

    Außerdem lernen die Programme, wie bestimmte Gegenstände miteinander interagieren: Beispielsweise, dass Otter sich oft in der Nähe von Wasser aufhalten und dass ihr Körper ähnlich aufgebaut ist wie der von anderen Säugetieren.

    Und schließlich hat das Programm so viel dazugelernt, dass es nicht nur Tiere, Gegenstände und Personen darstellen kann, sondern sogar bestimmte Kunst-Stile imitieren. Das Ergebnis — wie hier am Beispiel des Programms DALL-E 2 — kann beispielsweise ein Bild sein, das einen Otter im Stil des berühmten Malers Vermeer zeigt, und vom Werk eines Menschen auf den ersten Blick kaum zu unterscheiden ist.

    Welche Angebote gibt es?

    Wer die KI-Tools selbst ausprobieren möchte, hat mehrere Möglichkeiten: DALL-E, das wohl bekannteste Programm, ist bislang immer noch ausgewählten Nutzern vorbehalten und setzt seine Interessenten auf eine Warteliste.

    Andere Programme sind frei verfügbar, auch wenn die meisten davon Geld kosten. Die KI Midjourney beispielsweise lässt sich über das Chatprogramm Discord bedienen, und glänzt vor allem mit künstlerischen und abstrakten Bildern, tut sich aber noch schwer mit menschlichen Gesichtern und Körperteilen — beispielsweise wenn es darum geht, eine Hand mit der korrekten Anzahl von Fingern darzustellen.

    Besonders einfach machen es die Programme Stable Diffusion und Crayion (früher bekannt als DALL-E Mini). Diese lassen sich kostenlos im Web-Browser bedienen und ausprobieren.

    Wem gehören die KI-generierten Bilder?

    Jedes Tool kommt mit seinen eigenen Nutzungsbedingungen. In der Regel sehen diese vor, dass die Bilder der Person gehören, die sie generiert hat, also dem Nutzer. Einige Programme, darunter Midjourney, sehen jedoch Sonderregeln für die Verwendung durch große kommerzielle Unternehmen vor.

    Wie werden die Bilder verwendet?

    Schon jetzt zeichnet sich ab: Diese Technologie dürfte nicht weniger als eine Revolution darstellen. Für Blogs und Magazine stellen die computergenerierten Grafiken eine Alternative zu Stock-Fotos und Illustrationen dar, und werden jetzt schon von Publikationen wie The Atlantic verwendet.

    Die Vielseitigkeit der Technologie macht sie zudem zu einer Alternative zu Bildbearbeitungsprogrammen wie Photoshop. Mit DALL-E kann man nämlich nicht nur ganz neue Bilder generieren — man kann auch bereits existierende überarbeiten. Etwa indem man die Kleidung einer Person austauscht und daraus eine virtuelle Modenschau baut.

    Die Revolution hat erst begonnen

    Klar ist: Obwohl das Konzept der Technologie immer wieder kritisiert wird (beispielsweise von Illustratoren, die um ihre Aufträge fürchten), werden Bildgeneratoren wie DALL-E und Midjourney in der Zukunft eine wichtige Rolle spielen. Schon jetzt sind die Programme verblüffend gut, und sie werden immer besser. Die nächsten Entwicklungen sind nur eine Frage der Zeit.

    So arbeitet sogar TikTok aktuell an einem KI-Bildgenerator, der direkt in die App integriert ist. Damit würden schlagartig Millionen Menschen auf die Technologie aufmerksam.

    Zu schaffen macht auch, dass die Tools missbraucht werden könnten. Ein Start-up namens Stability AI hat kürzlich angekündigt, einen Bildgenerator praktisch ohne Richtlinien zu veröffentlichen — damit könnte es beispielsweise möglich sein, falsche Nacktfotos von echten Personen zu erstellen.

    "Hier ist Bayern": Der BR24 Newsletter informiert Sie immer montags bis freitags zum Feierabend über das Wichtigste vom Tag auf einen Blick – kompakt und direkt in Ihrem privaten Postfach. Hier geht’s zur Anmeldung!

    Europäische Perspektiven

    BR24 wählt regelmäßig Inhalte von unseren europäischen öffentlich-rechtlichen Medienpartnern aus und präsentiert diese hier im Rahmen eines Pilotprojekts der Europäischen Rundfunkunion.