KI-Bildgeneratoren, Teil I

Im unserer Serie „KI für Bildermacher“ erläutert Tilo Gockel, wie die Generatoren funktionieren und welche Tools empfehlenswert sind.

KI-Bildmaschine

Vladimir Putin im Kniefall vor Chinas Präsidenten Xi Jinping, der Papst im Daunenmantel, Fantasie-Bildcollagen – aber auch verblüffend perfekte Landschaften, Stills und Portraits: Die neuen KI-Bildmaschinen machen vor (fast) nichts halt. Zwischen Unbehagen und Euphorie gibt es eine Fülle pragmatischer Möglichkeiten, wie Fotografen KI-Werkzeuge für ihre Arbeit nutzen können. Von Tilo Gockel

Wie der schnelle Durchbruch der KI-Bildgeneratoren möglich wurde

Midjourney, der Platzhirsch unter den KI-Bildmaschinen, erblickte im Juli 2022 das Licht der Welt. Mittlerweile sind gerade mal zwei Jahre vergangen, die Software steht bei Version 6.0 und kann bereits charakterkonsistente Bilder generieren – man kann nun selbst ein immergleiches Gesicht für eine Bildserie vorgeben. Andere KI-Modelle überholen Midjourney links und können sogar Filmsequenzen generieren (OpenAI Sora) oder Stimmen imitieren (OpenAI Voice Engine).

Der erstaunlich schnelle Durchbruch der generativen KI-Bildmaschinen wurde durch zwei parallele Entwicklungen möglich. Zum einen ist die Anzahl qualitativ hochwertiger Bilder im Web seit Anbeginn exponentiell gewachsen. Man geht von einem Bild-Upload von fast 2 Billionen Fotos im letzten Jahr 2023 aus 1. Diese Fotos sind zu einem guten Teil für Webcrawler frei zugänglich und oft auch (und das ist wichtig) im HTML-Umfeld mit einem alternativen Text zur Beschreibung versehen. Zum anderen wurden bestimmte Methoden der Künstlichen Intelligenz wie die Künstlichen Neuronalen Netze (KNN) wesentlich weiterentwickelt und die verfügbaren Rechnerressourcen erweitert.

Wie die KI-Bildmaschinen funktionieren

Am Anfang steht als lernfähiger Algorithmus das Künstliche Neuronale Netz. Es nutzt als Blaupause das menschliche Gehirn und setzt sich genauso wie dieses aus Neuronen zusammen, die Eingangssignale empfangen, diese gewichtet addieren können und die untereinander vernetzt sind. Beim Überschreiten einer Signalschwelle beginnen die Neuronen zu feuern. Die Gewichtung und der Schwellwert werden im Zuge eines vorgeschalteten Lernzyklus für jedes Neuron automatisch berechnet. In der Abbildung sehen Sie einen Screenshot aus einem interaktiven Online-Programm …

 


Sie wollen den kompletten Beitrag in der aktuellen Ausgabe lesen? Hier können Sie die digit! 2-2024 kaufen!