Imagination-to-Image: Intendierte Visualisierung von Imaginationen mit KI

Wie sieht eine Zukunft des Lernens aus, die wir uns nur in Gedanken ausmalen?
Diese Frage stand am Anfang des Forschungsprojekts «Imagination-to-Image», das an der Pädagogischen Hochschule Bern (PHBern) in Zusammenarbeit mit der Hochschule der Künste Bern (HKB) durchgeführt wurde. Ziel war es, mit Künstlicher Intelligenz (KI) individuelle Vorstellungen und Ideen visuell greifbar zu machen.
  

Grundlagenbilder erstellt mit Dalle3 (Prompt: «Imagination in a bubble turns into a picture»)

Hintergrund

I. IMAGINATION UND IHRE RELEVANZ
Imagination spielt bei Innovationen und in der Forschung eine wichtige Rolle, aber auch in der täglichen Bildungspraxis z.B. bei der Ideenentwicklung. Creative Labs, Denkfabriken und Zukünfte-Labore sind allgemeine Beispiele für Formate und Orte, an denen mit Imaginationen gearbeitet wird. Auch bei den beiden an diesem Projekt beteiligten Projektpartnern (Think Tank Medien und Informatik der PHBern & Y Institut der HKB / BFH) spielt die Imagination eine relevante Rolle.

II. INTENDIERTE VISUALISIERUNG
Als Kriterium zur Zielerreichung diente in diesem Projekt die «Nähe» des KI-generierten Outputs zur ursprünglichen Imagination. Deshalb wird auch von «intendierter» Visualisierung gesprochen. Diese ist im Unterschied zu einer reinen Ideengenerierung durch KI zu sehen, denn das Ziel ist, die Imagination möglichst getreu zu visualisieren. Der Nutzen einer solchen Generierung liegt in der Visualisierung einer individuellen Imagination, die dann z.B. allen Stakeholdern als Grundlage für Entwicklungen zur Verfügung steht.

Projektschwerpunkte

Das vorliegende Projekt verfolgte die folgenden drei Schwerpunkte:

SCHWERPUNKT I. EIGNUNG VON KI-GENERATOREN ZUR VISUALISIERUNG VON IMAGINATIONEN
Testreihen zeigten in diesem Projekt, inwieweit KI-Generatoren sich eignen, um Imaginationen sichtbar zu machen. Hierbei kommt der Erstellung eines Kriterienkatalogs eine wichtige Rolle zu. Dieser wurde zur Evaluation eingesetzt, um die Nähe des KI-Outputs zur ursprünglichen Imagination der Person zu bewerten.

SCHWERPUNKT II. PROMPT-GENERIERUNG UND -OPTIMIERUNG
Getestet wurden im Rahmen dieses Projekts verschiedene Prompt-Techniken, die auf der Thematik «Wie spricht man über Bilder» aufsetzt. Der Prompt als «die Sprache, die KI versteht» stellte hier eine wichtige Komponente und Zielgrösse dar. Genau hier wurden die Kompetenzen der HKB als Projektpartner relevant, denn Bildsprache, Bildbeschreibung, Bildwahrnehmung und Bildinterpretation fallen in ihren Expertisenbereich.

SCHWERPUNKT III. IMPLEMENTIERUNG UND NUTZBARMACHUNG
Konkret und als praktische Anwendung wurden die Ergebnisse des vorliegenden Projekts direkt umgesetzt. So für die Visualisierung von Imaginationen zur zukünftigen Entwicklung von Bildung und Schule im Rahmen von entsprechenden Lehr-Lern-Formaten. Denkbar waren ebenfalls Umsetzungen innerhalb von schulischen Makerspaces, zur Brainstorming-Visualisierung, zur Dokumentation von Strategieprozessen oder der Hervorhebung von neuen Ideen.

Projektskizze

Projektergebnisse

Im Rahmen des Projekts wurden verschiedene Visualisierungsansätze theoretisch erarbeitet und getestet, darunter die originalnahe Visualisierung (OV), die auf die Kernaussage reduzierte Visualisierung (KV) sowie textbasierte Visualisierung (TV) und die zeichnungsbasierte Visualisierung (ZV). Dabei zeigte sich, dass KI zwar in der Lage ist, beeindruckende Bilder zu generieren, jedoch oft nicht exakt den Vorstellungen der Nutzer*innen entspricht. Besonders schwierig erwies sich die textbasierte Bildgenerierung, da vor allem komplexere Szenarien kaum kohärent dargestellt wurden. Erfolgreicher war die Kombination aus Skizzen, Text und KI-gestützter Bildverarbeitung, die genauere und konsistentere Ergebnisse lieferte.  

Ein zentrales Thema des Projekts war zudem die ethische Reflexion der KI-Nutzung. Es wurde festgestellt, dass einige KI-Modelle geschlechtsspezifische Verzerrungen aufwiesen, indem sie etwa überproportional weibliche Figuren generierten. Auch technische Herausforderungen, wie die optimale Steuerung der KI durch gezielte Prompt-Formulierungen und das Einstellen der entsprechenden Parameter, spielten eine grosse Rolle.

Trotz dieser offenen Fragen zeigt das Projekt, dass KI in der kreativen Arbeit ein mächtiges Werkzeug ist. Die besten Ergebnisse wurden durch eine Kombination aus umfassendem Ausgangsmaterial, dem Einsatz der KI-Technologie (inkl. Inpainting) und einer digital-händischen Nachbearbeitung der KI-generierten Bilder erzielt. Zielführend könnte auch das Vorgehen sein, als Endprodukt eine Collage anzustreben und hierfür umfangreiche Szenarien in Einzelinhalte aufzuteilen, die dann separat voneinander visualisiert werden.  

Sowohl der Endbericht des Projekts als auch eine vertonte Präsentation der Ergebnisse können auf dieser Seite (oben rechts) heruntergeladen werden.

Leitung
Angelika Neudecker | mehr über Angelika

Projektbeteiligte
Uwe Dirksen | mehr über Uwe
Andi Schoon | mehr über Andi
Maren Polte | mehr über Maren
Jimmy Schmid | mehr über Jimmy

Laufzeit
01.07.2024 bis 31.12.2024

Abschlussbericht
Hier geht es zum Abschlussbericht
Hier geht es zum Videorückblick auf das Projekt