Ausgangspunkt meines Fotoprojekts war die Faszination für KI und die Frage, wie transparent diese ist oder sein kann – insbesondere in Bezug auf Bildgenerierung. Mein Ziel war es dabei, Einblicke in die inneren Abläufe der KI zu gewinnen. Der Begriff der Black Box, der im Seminar immer wieder auftauchte, wurde zum Leitmotiv meines Fotoprojekts. Konkret waren folgende Fragen zentral: Wie gut kann ChatGPT aufgrund eigener Bildbeschreibungen Bilder rekonstruieren – und was verrät dieser Prozess über die Funktionsweise der KI? Lässt sich durch ein bewusst gestaltetes Experiment ein Einblick in die Black Box der KI gewinnen – oder bleibt diese komplett verschlossen?
In meinem Fotoprojekt habe ich verschiedene eigene Fotografien gemacht und ChatGPT gebeten, diese möglichst exakt zu beschreiben. Die so generierten Beschreibungen habe ich anschliessend als Input verwendet, um ein neues Bild von ChatGPT generieren zu lassen. Anschliessend habe ich den gleichen Prozess mit einem anderen Account wiederholt, um zu prüfen, ob ChatGPT durch Zwischenspeicherung auf frühere Bilder zurückgreift. Wären die beiden Ergebnisse – also die jeweils generierten Bilder durch ChatGPT – dabei deutlich voneinander abgewichen, hätte das auf ein Wiedererkennen hingedeutet. Tatsächlich aber waren die Bilder einander erstaunlich ähnlich – ein Hinweis darauf, dass die KI tatsächlich nur auf die Prompts reagiert, also generativ arbeitet und nicht auf vorherige Uploads zurückgreift.
ChatGPT reagierte sehr sensibel auf Bildkomplexität und erzeugte je nach Motiv unterschiedliche Beschreibungen – von Fliesstext bis hin zu Tabellen mit Distanz- und Prozentangaben. Die daraus generierten Bilder wiesen teils erstaunliche Ähnlichkeiten mit dem Originalfoto auf – und ebenso systematische Unterschiede: weniger Kontrast, pastelligere Farben, gleichmässige Ausleuchtung. Die Ergebnisse zeigen, dass präzise Prompts eine zentrale Rolle dabei spielen, wie nah ChatGPT dem Originalbild kommt.
Auch wenn mein Experiment oberflächliche Einblicke in die Funktion des text2im-Interfaces gibt, das ChatGPT verwendet, bleibt das Herzstück der KI – die Black Box selbst – verschlossen. Für weitere Untersuchungen wäre der Zugang zu Trainingsdaten oder auch zur Modellarchitektur notwendig. Gleichzeitig ergeben sich durch das Projekt neue Fragen: Wie sehr prägt das Weltbild der Trainingsdaten den Output? Und inwiefern reproduziert die KI visuelle Normen, die wir selbst unbewusst mitprägen?
© Aléna Sauthier
Quick Links
Social Media