Medien des Monats Dezember: Deepfakes – Wenn man Augen und Ohren nicht mehr trauen kann

KI erweckt Geschichte visuell zum Leben

Michael Katzlberger

Der KI-Bildgenerator Stable Diffusion hat in den letzten Monaten viel Aufmerksamkeit erregt. Diese Technologie erlaubt auch nicht-programmieraffinen Menschen, kreativ zu sein. Das zeigt sich in einer Vielzahl an Bildern und Videos, die mit diesem Modell bereits erstellt wurden. Und die Entwicklung wird sich in diesem Bereich absehbar weiter beschleunigen.

Deepfakes – Wenn man Augen und Ohren nicht mehr trauen kann

KI erweckt Geschichte visuell zum Leben | KI und maschinelles Lernen | bpb.de

Links eine Büste von Julius Cäsar (zu Lebzeiten angefertigt). Das Bild rechts wurde mit dem KI-Bildgenerator Midjourney 5.2 auf Basis dieses Referenzbildes erstellt. (© Michael Katzlberger, 3LIOT.ai, Technologie: Midjourney 5.2)

So funktioniert Stable Diffusion

Sogenannte Diffusionsmodelle wie Stable Diffusion (SD) „zerstören“ Bilddaten, mit denen die KI-Modelle vorher trainiert wurden, indem sie diesen Daten Rauschen hinzufügen. Dann lernen sie, wie sie die Daten wiederherstellen können, indem sie das Rauschen wieder entfernen. Aus diesem Rauschen entsteht ein neues BildZur Auflösung der Fußnote[1].

Das von einer KI generierte Bild zeigt ein Auto, das auf einer Landstraße vor einem Apfelbaum steht. Rechts im Bild sitzt ein Hund. Der Himmel ist blau mit vereinzelten Wolken. Um die Bildobjekte Straße, Wiese, Auto, Baum, Apfel, Hund und Wolke sind jeweils farbige Quadrate mit Zahlenangaben. Baum: 0,993, Apfel: 0,96, Wolke: 0,96, Auto:0,99, Hund: 0,98, Wiese: 0,67, Straße: 0,998. — Damit ein Bild mittels einer Texteingabe entstehen kann, muss es im Trainingsprozess vorher möglichst präzise „beschrieben“ werden. Nur so kann eine Bild-KI wie Midjourney später ein Bild generieren. (© Michael Katzlberger, 3LIOT.ai, Technologie: Midjourney 5.2)

Damit ein Bild mittels einer Texteingabe entstehen kann, muss es im Trainingsprozess vorher möglichst präzise „beschrieben“ werden. Nur so weiß das Stable-Diffusion-Modell, was es tun soll. Das macht man, indem man ein Sprachmodell mit den Bildern verknüpft. Dieser Vorgang wird einerseits von Menschen durchgeführt, die auf einzelne Elemente in einem Bild klicken und es damit beschreiben, in letzter Zeit aber auch verstärkt von KIs selbst.

Im Vergleich zu früheren KI-Bildmodellen, deren Rechenprozesse sehr aufwändig, langsam und somit kostspielig waren, kann das Open-Source-Modell Stable Diffusion schon in wenigen Sekunden Bilder in hoher Qualität erzeugen. Zudem ist das Modell über einfache Web-Oberflächen wie DALL-E 2 von OpenAI oder Midjourney auch Nicht-Programmier:innen zugänglich.Zur Auflösung der Fußnote[2]

Stable Diffusion in der historischen Bildung

In der historischen Bildung spielt die Visualisierung seit jeher eine wichtige Rolle, um komplexe Ereignisse und Zusammenhänge besser verstehen und vermitteln zu können. Auch wenn Stable Diffusion keine exakte Rekonstruktion historischer Szenen liefern kann, sondern vielmehr kreativ interpretiert: Mit dieser Technologie können Historiker:innen nun zusätzlich auf innovative Art und Weise vergangene Szenen rekonstruieren und visualisieren. So kann es Schüler:innen und Student:innen ermöglicht werden, ein tieferes Verständnis für historische Ereignisse entwickeln und ein lebendigeres und anschaulicheres Bild von Geschichte zu erhalten.

Es gibt eine breite Palette an Einsatzmöglichkeiten von SD im Unterricht:

Durch Textbeschreibungen, die in das in das Modell eingegeben werden, können Lehrkräfte Bilder generieren, die den Schüler:innen dabei helfen, sich historische Szenen besser vorzustellen.
SD kann auch dazu verwendet werden, historische Orte und Gebäude zu rekonstruieren. Durch die Eingabe von Beschreibungen historischer Stätten, werden Bilder generiert, die zeigen, wie diese Orte in der Vergangenheit wahrscheinlich ausgesehen haben. So können Schüler:innen einen virtuellen Rundgang durch historische Stätten vornehmen.
Das Bildmodell kann außerdem historische Artefakte generieren. Wenn Lehrkräfte Beschreibungen von Artefakten wie antiken Münzen, Gemälden oder Schriftrollen eingeben, werden mithilfe des Modells Bilder erzeugt, die diesen Artefakten ähneln.

Lehrer:innen, Schüler:innen und Student:innen können also ihre Vorstellungskraft und Kreativität nutzen, um alternative Darstellungen von Geschichte zu generieren und eigene Interpretationen historischer Ereignisse zu entwickeln.

Gefahren, Grenzen und Herausforderungen

Wie bei vielen bahnbrechenden Entwicklungen, bestehen auch bei der Nutzung von Stable Diffusion potenzielle Gefahren und Herausforderungen – insbesondere im Zusammenhang mit Geschichtsrevisionismus und der Erstellung von Desinformation.

Das von dem KI-Bildgenerator Midjourney erstellte Bild zeigt Olaf Scholz, der eine Militärweste trägt und in die Kamera winkt. — Vermeintliches Handyfoto von Olaf Scholz auf einer Irak-Mission im Juni 2023. Dieses Ereignis hat so nicht stattgefunden. Das Bild wurde mit dem KI-Bildgenerator Midjourney 5.2 erstellt. (© Michael Katzlberger, 3LIOT.ai, Technologie: Midjourney 5.2)

So birgt Stable Diffusion das Risiko, dass gefälschte Bilder erzeugt werden können, die als „authentischer Beweis“ für Ereignisse oder Situationen verwendet werden, die in der Realität so nicht stattgefunden haben. Es besteht außerdem die Gefahr, dass mit Tools wie Midjourney beispielsweise Bilder erzeugt werden, die bestimmte historische Ereignisse in einem veränderten Licht darstellen oder diese sogar ganz leugnen.

Diffusionsmodelle können auch dazu genutzt werden, Bilder zu manipulieren und zu verfälschen. Personen oder Objekte können in Bildern hinzugefügt, entfernt oder verändert werden, um bestimmte Narrative zu unterstützen. Mit den manipulierten Bildern kann wiederum Propaganda verbreitet, können Wahlkämpfe beeinflusst und das Vertrauen in authentische Bildquellen im Allgemeinen untergraben werden.

Auf dem mit dem KI-Bildgenerator Midjourney erstelltem Bild sieht man Barack Obama, der den Papst umarmt. Beide lachen. — Barack Obama umarmt Papst Franziskus in Schönbrunn, Wien 2023. Dieses Treffen hat nie stattgefunden, das Bild wurde mit dem KI-Bildgenerator Midjourney 5.2 erstellt. (© Michael Katzlberger, 3LIOT.ai, Technologie: Midjourney 5.2)

Mit fortschreitender Technologie wird es auch für geschulte Expert:innen immer schwieriger werden, gefälschte Bilder von echten Bildern zu unterscheiden. Problematisch ist auch die Verstärkung von Vorurteilen und Stereotypen. So zeigt eine Eingabe des Wortes „Frau“ in herkömmliche KI-Bildertools in der Regel eine weiße, mitteleuropäische Frau zwischen 20 und 30 Jahren.

Um solchen Verzerrungen und Bias entgegenzuwirken, sollten Menschen unbedingt über die Möglichkeiten und Grenzen von Technologien wie Stable Diffusion aufgeklärt werden. Dies umfasst die Förderung von Medienkompetenz, kritischem Denken und der Fähigkeit, gefälschte Inhalte zu erkennen und zu hinterfragen.

Immer wieder gibt es auch urheberrechtliche Bedenken rund um Modelle wie Stable Diffusion. Im Januar wurde bekannt, dass die Bildagentur Getty Images die Entwickler:innen von SD wegen des sogenannten „Scrapings“ von urheberrechtlich geschützten Inhalten verklagt hat. Getty behauptet, Stability AI habe Millionen von Bildern von seiner Website unrechtmäßig abgegriffen.Zur Auflösung der Fußnote[3] Solche Rechtsstreitigkeiten zwischen KI-Firmen und Urheber:innen von Inhalten könnten in Zukunft weiter zunehmen.

Entwicklungsperspektiven von Stable Diffusion für die historische Bildung

Stable Diffusion kann dazu genutzt werden, lebendige, interaktive Lehrmaterialien für den Geschichtsunterricht herzustellen. Man stelle sich vor, wie Schüler:innen nicht nur über historische Ereignisse lesen, sondern diese auch visuell mitgestalten können, indem sie Bilder oder Szenen erzeugen, die auf historischen Beschreibungen basieren. Museen könnten Stable Diffusion nutzen, um ihre Ausstellungen zu bereichern und so den Besucher:innen einen weiteren Zugang zu Geschichte ermöglichen.

Nicht zuletzt ist die Technologie interessant für die Film- und Unterhaltungsindustrie, um realistische Kulissen und Szenen aus verschiedenen historischen Epochen zu erstellen. Basierend auf schriftlichen Beschreibungen aus Tagebüchern, Briefen oder anderen historischen Dokumenten entstehen mit SD beispielsweise Bühnenbilder und Kostüme aller Art.

Sie dürfen den Text unter Nennung der Lizenz CC BY-SA 4.0 und des/der Autors/-in teilen.
Urheberrechtliche Angaben zu Bildern / Grafiken / Videos finden sich direkt bei den Abbildungen.