Ein Beitrag für den Blog „Künstliche Intelligenz – Zwischen Verheißung und Wirklichkeit"
In einem früheren Beitrag haben wir uns mit Audio-Deepfakes beschäftigt – der synthetischen Nachahmung von Stimmen, die so überzeugend geworden ist, dass selbst kritische Zuhörer getäuscht werden. Was aber, wenn nicht nur die Stimme gefälscht ist, sondern das gesamte Bild eines Menschen? Wenn man sieht, wie jemand spricht, sich bewegt, Emotionen zeigt – und das alles niemals stattgefunden hat?
Willkommen in der Welt der Video-Deepfakes. Einer Welt, in der das alte Sprichwort „Ich glaube nur, was ich mit eigenen Augen sehe" endgültig seine Gültigkeit verloren hat.
1. Was ist überhaupt ein Video-Deepfake?
Der Begriff setzt sich zusammen aus „Deep Learning" – einer Methode des maschinellen Lernens – und „Fake". Die Technologie dahinter ist komplex, das Ergebnis erschreckend einfach zu konsumieren: Ein KI-Algorithmus analysiert Hunderte oder Tausende von Bildern einer Person, lernt deren Gesichtszüge, Mimik und Bewegungsmuster – und ist dann in der Lage, dieses Gesicht überzeugend auf eine andere Person zu übertragen. Oder der Mund einer Person wird so manipuliert, dass sie Worte zu „sagen" scheint, die sie nie geäußert hat.
Je mehr Videomaterial von einer Person vorhanden ist, desto besser funktioniert das maschinelle Lernen. Und dank kostenloser und benutzerfreundlicher Face-Swap-Programme können Deepfakes heute ohne besondere technische Kenntnisse erstellt werden. Die qualitative Bandbreite reicht von erkennbar amateurhaft bis täuschend perfekt.
Technisch gesprochen: Die Modelle speichern keine einzelnen Videos, sondern lernen statistische Muster aus riesigen Trainingsdatensätzen. Wer mit Datenspeicherung und Datenkompression vertraut ist, erkennt die Analogie sofort – nicht das Bild selbst wird gespeichert, sondern seine abstrahierte Repräsentation. Und aus dieser Abstraktion lässt sich dann beliebig Neues generieren.
2. Wie verbreitet sind Video-Deepfakes? Zahlen, die erschrecken
Die Entwicklung der letzten Jahre ist in ihrer Dynamik kaum zu fassen. In absoluten Zahlen stieg die Anzahl verbreiteter Deepfakes von etwa 500.000 im Jahr 2023 auf prognostizierte 8 Millionen im Jahr 2025 – eine Sechzehnfachung in zwei Jahren.
Noch beunruhigender: Die Zahl der gemeldeten Deepfake-Vorfälle hat sich im Jahr 2025 gegenüber dem Vorjahr verfünffacht. Statistisch gesehen fand im Jahr 2024 alle fünf Minuten irgendwo auf der Welt ein Deepfake-Angriff statt. Und etwa die Hälfte aller Unternehmen weltweit meldete 2024 Betrugsfälle mit Audio- oder Video-Deepfakes.
Das Fassungsvermögen des menschlichen Auges hält damit schlicht nicht Schritt: Nur 0,1 Prozent der Teilnehmer einer wissenschaftlichen Studie konnten alle Deepfake-Inhalte korrekt als gefälscht identifizieren – selbst dann, wenn sie ausdrücklich danach gefragt wurden, genau hinzuschauen. 57 Prozent der Menschen glauben, einen Deepfake erkennen zu können. Die tatsächlichen Trefferquoten zeigen: Diese Selbsteinschätzung ist eine gefährliche Illusion.
3. Die Unternehmen: Wer steckt hinter der Technologie?
Es wäre falsch, Video-Deepfake-Technologie ausschließlich mit Kriminalität zu verbinden. Hinter ihr steht eine globale Industrie mit teils beeindruckenden Produkten und seriösen Anwendungsfällen – aber eben auch mit erheblichen Missbrauchspotenzialen.
OpenAI (USA) gilt mit seinem Modell Sora als einer der Technologieführer im Bereich KI-Videogenerierung. Sora kann aus reinen Textbeschreibungen kinoreife, physikalisch konsistente Videos erzeugen. Die Qualität ist so hoch, dass Filmemacher und Werbeagenturen das Tool bereits professionell einsetzen – aber eben auch, dass realistische Fälschungen von Personen technisch trivial geworden sind.
RunwayML (USA) ist ein weiterer Platzhirsch: ein kreatives KI-Studio, das sich besonders an Filmemacher richtet und feingranulare Kontrolle über Bewegung, Stil und Kameraführung bietet. Ab etwa 12 Dollar pro Monat für jedermann zugänglich.
Google hat mit Veo ein leistungsfähiges Videogenerierungsmodell in seinen KI-Diensten integriert. Auch Meta arbeitet intensiv an ähnlichen Systemen. Der Wettbewerb zwischen den Tech-Giganten treibt die Qualität – und die Missbrauchspotenziale – rasant voran.
Synthesia (UK) spezialisiert sich auf KI-Avatare für Unternehmenskommunikation und Trainingsvideos: ein sprechendes Abbild eines Menschen, ohne Kamera, ohne Studio. Legitim und weit verbreitet im Unternehmenseinsatz, aber technologisch nah an dem, was Kriminelle für Identitätsdiebstahl nutzen.
Pika Labs (USA) bietet mit seiner Plattform kreative Video-Effekte für Social-Media-Inhalte und hat sich besonders durch seine Zugänglichkeit einen Namen gemacht – schnelle Generierung, günstige Preise, riesige Nutzerbasis.
Und dann ist da noch ein deutsches Unternehmen, das in diesem Kontext nicht fehlen darf: Black Forest Labs GmbH aus Freiburg im Breisgau. Bekannt vor allem für seinen revolutionären Bildgenerator FLUX, arbeitet das Unternehmen an der nächsten Generation visueller KI – einschließlich eines Videogenerierungsmodells, das mit Sora und Veo konkurrieren soll. Black Forest Labs wurde 2024 gegründet, erreichte innerhalb weniger Monate Einhorn-Status und ist heute Deutschlands wertvollstes KI-Unternehmen. Die Gründer haben mit der Entwicklung von Stable Diffusion die gesamte heutige Bildgenerierung erst möglich gemacht. Das frühe FLUX-Modell stand allerdings auch in der Kritik, weil es weniger strikte Inhaltsfilter hatte als Mitbewerber – ein Problem, das das Unternehmen inzwischen angegangen ist.
Gemeinsam ist all diesen Unternehmen: Sie entwickeln Werkzeuge, die an sich neutral sind. Wie bei jedem mächtigen Werkzeug entscheidet die Absicht des Nutzers darüber, ob das Ergebnis nützlich oder schädlich ist.
4. Die harmlose Seite: Satire, Unterhaltung, Kunst
Nicht jeder Deepfake ist ein Verbrechen. Es gibt durchaus legitime, kreative und manchmal schlicht amüsante Anwendungen.
In der Filmbranche werden Deepfakes eingesetzt, um verstorbene Schauspieler kurz auftreten zu lassen, Jungversionen von Darstellern zu zeigen oder teure Nachdreharbeiten zu vermeiden. Hollywood nutzt die Technologie seit Jahren – mit zunehmendem Komfort und sinkenden Kosten.
In der Satire hat der Deepfake seinen festen Platz gefunden. Comedysendungen lassen Politiker Dinge sagen, die sie so nie gesagt hätten – mit deutlicher Kennzeichnung als Satire, versteht sich. Das ist nicht neu: Schon Kabarettisten haben immer Stimmen imitiert und Worte in fremde Münder gelegt. Der Deepfake macht es nur erschreckend realistisch.
Viral gegangen sind über die Jahre zahlreiche harmlose Kuriositäten: Nicolas Cage, dessen Gesicht in gefühlt jeden Hollywood-Film eingefügt wurde. Historische Persönlichkeiten, die plötzlich zu modernen Hits tanzen. Solche Beispiele haben auch medienpädagogischen Wert – sie zeigen anschaulich, was die Technologie kann, und schärfen das Bewusstsein für ihre Grenzen.
Das Fazit dieses Abschnitts muss dennoch nüchtern ausfallen: Die Grenze zwischen harmlosen Witzen und echtem Schaden ist technisch inexistent. Dieselbe Software, dieselbe Infrastruktur, dieselben Modelle – nur die Absicht unterscheidet Unterhaltung von Missbrauch.
5. Der Skandal: Deepfake-Pornografie
Dieser Abschnitt erfordert Ernsthaftigkeit. Deepfake-Pornografie – die nicht-konsensuelle Erstellung sexualisierter Fälschungen realer Personen – ist eine der verbreitetsten und schädlichsten Anwendungsformen dieser Technologie.
Im Januar 2024 verbreiteten sich explizite, KI-generierte Deepfake-Bilder der Musikerin Taylor Swift rasant auf Plattformen wie X (früher Twitter). Ein einzelner Post wurde über 47 Millionen Mal aufgerufen, bevor er gelöscht wurde. Der Vorfall löste eine globale Debatte aus und brachte Gesetzgeber weltweit dazu, strengere Regeln zu fordern.
Taylor Swift ist kein Einzelfall. Scarlett Johansson wurde mehrfach Opfer von Stimmenklonen und pornografischen Deepfakes. Jenna Ortega sah sich gezwungen, ihren Twitter-Account aufgrund von Deepfake-Pornografie komplett zu löschen. Auch Heidi Klum wird in Deutschland laut Sicherheitsforschern regelmäßig für betrügerische Deepfake-Inhalte missbraucht.
Der erschütterndste deutsche Fall ist der von Collien Fernandes und ihrem Ex-Mann Christian Ulmen. Im März 2026 berichtete der Spiegel, dass Fernandes Strafanzeige gegen Ulmen erstattet hat. Sie wirft ihm vor, über Jahre hinweg Fake-Profile in ihrem Namen erstellt und pornografische Deepfakes von ihr verbreitet zu haben – ein Missbrauch, der sich offenbar über fast ein Jahrzehnt erstreckte. Fernandes beschrieb das als „virtuellen Vergewaltigungsakt". Besonders verstörend: Bereits 2024 hatte sie in einer ZDF-Dokumentation nach dem Urheber dieser Deepfakes gesucht – und dabei, ohne es zu wissen, möglicherweise mit dem mutmaßlichen Täter selbst gechattet.
Christian Ulmen bestreitet die Vorwürfe. Für ihn gilt die Unschuldsvermutung. Seine Anwälte bezeichnen die Berichterstattung als „unzulässigen Suggestivjournalismus". Der Fall hat Deutschland erschüttert, Demonstrationen ausgelöst und eine parlamentarische Debatte über die gravierenden Lücken im Strafrecht angestoßen. Justizministerin Stefanie Hubig sprach sich öffentlich für härtere Strafen bei digitaler Gewalt aus.
Das britische Online-Sicherheitsgesetz verbietet mittlerweile die Verbreitung von Deepfake-Pornografie – die Erstellung selbst ist jedoch noch nicht überall strafbar. Hier klafft eine gefährliche Gesetzeslücke.
6. Das Schlimmste: Kinder und Jugendliche als Opfer
Deepfake-Technologie wird zunehmend gegen Minderjährige eingesetzt – eine Entwicklung, die in ihrer Schwere kaum zu überschätzen ist.
In mehreren dokumentierten Fällen in den USA und Europa haben Schüler KI-Tools genutzt, um sexualisierte Deepfake-Bilder von Mitschülerinnen zu erstellen und zu verbreiten. Die psychologischen Schäden für die Opfer sind enorm; Betroffene berichten von Angst, sozialer Isolation und langfristigen Traumata. Die Täter sind oft selbst noch Teenager – was die strafrechtliche Handhabung zusätzlich erschwert.
Kinderpornografisches Material, das mittels KI generiert wurde, fällt in Deutschland unter § 184b StGB – unabhängig davon, ob echte Kinder abgebildet sind oder nicht. Die Rechtslage ist hier vergleichsweise klar. Was fehlt, ist die konsequente Strafverfolgung und die technische Infrastruktur zur Erkennung und Löschung solcher Inhalte.
Medienpädagogen betonen: Kinder und Jugendliche brauchen keine Angst als Lebensgrundlage, aber kritische Urteilsfähigkeit als Rüstzeug. Die Fähigkeit zu hinterfragen, was man sieht, muss heute genauso selbstverständlich gelehrt werden wie Lesen und Schreiben.
7. Kriminelle Politik: Wenn Deepfakes Wahlen manipulieren
Deepfakes kommen verstärkt bei politischen Wahlen zum Einsatz. Ein bekanntes Beispiel ist ein gefälschtes Video des ukrainischen Präsidenten Selenskyj, das zu Beginn des russischen Angriffskrieges verbreitet wurde und ihn zur Kapitulation aufrufen ließ – ein Inhalt, den er niemals produziert hatte.
Auch in Deutschland blieb man davon nicht verschont. Während der Bundestagswahl kursierten gefälschte Videos von Friedrich Merz und Olaf Scholz. Ein weiterer typischer Fall: Ein KI-generiertes Video ließ den Arzt und TV-Moderator Eckart von Hirschhausen für ein angebliches Wundermedikament werben – der echte Hirschhausen hatte davon keine Kenntnis.
Statistisch waren im Jahr 2025 Personen aus der Politik mit über 32 Prozent die am häufigsten missbrauchte Gruppe bei Deepfake-Vorfällen weltweit. Die eigentliche Gefahr liegt nicht im Einzelfall, sondern in der schleichenden Erosion des Vertrauens: Wenn jedes Video potenziell gefälscht sein könnte, entsteht ein gesellschaftliches Klima des generellen Misstrauens – und das ist politisch gefährlich, unabhängig davon, wer gerade das Ziel ist.
8. Wie erkennt man ein Deepfake-Video?
Ein paar praktische Hinweise – auch wenn sie kein Allheilmittel sind:
Inhaltliche Prüfung: Woher stammt das Video? Ist die Quelle seriös? Stehen die gezeigten Aussagen im Widerspruch zu dem, was die Person üblicherweise sagt und tut? Faktencheck-Seiten wie der Faktenfinder der Tagesschau können wertvolle Hilfe leisten.
Technische Hinweise: Deepfakes haben häufig noch Schwächen an bestimmten Stellen – unnatürliche Übergänge am Haaransatz oder Ohrrand, seltsam wirkende Zähne, fehlerhafte Hände, unnatürliches Blinzeln oder fehlende Schatten am Hals. Bei schnellen Kopfbewegungen verlieren viele Modelle noch an Qualität.
Der gesunde Menschenverstand: In emotional aufgeladenen Situationen – Schockvideos, vermeintliche Skandale, Videos die man unbedingt weiterleiten soll – ist besondere Vorsicht geboten. Genau dann, wenn ein Deepfake maximalen Schaden anrichten soll, wirkt er am überzeugendsten.
Die ehrliche Botschaft muss dennoch sein: Technische Laien werden einem hochwertigen Deepfake kaum auf den ersten Blick ansehen, dass er gefälscht ist. Das ist keine Schwäche des Betrachters – es ist der Stand der Technik.
9. Wie muss das Internet der Zukunft mit Video-Deepfakes umgehen?
Diese Frage ist nicht nur technischer, sondern zutiefst gesellschaftlicher Natur. Ein paar Eckpunkte aus der aktuellen Debatte:
Kennzeichnungspflicht: Alle KI-generierten Inhalte müssen als solche erkennbar sein. Der EU AI Act geht in diese Richtung und verpflichtet Anbieter zur Kennzeichnung synthetischer Medien. Das ist ein Anfang – aber nur einer.
Strafbarkeit der Erstellung, nicht nur der Verbreitung: Wer nicht-konsensuelles intimes Bildmaterial mit KI erstellt, muss sich strafbar machen – unabhängig davon, ob er es veröffentlicht oder nicht. Deutschland hat nach dem Fall Fernandes/Ulmen begonnen, die Gesetzgebung zu verschärfen.
Plattformverantwortung: Soziale Netzwerke müssen Deepfakes aktiv erkennen und entfernen – nicht erst nach Meldung durch Betroffene, sondern proaktiv. Die Technologie zur Detektion existiert; was fehlt, ist der politische und unternehmerische Wille zur konsequenten Anwendung.
Technische Wasserzeichen: Der sogenannte C2PA-Standard (Coalition for Content Provenance and Authenticity) ermöglicht digitale Herkunftsnachweise für Medieninhalte – ähnlich einem kryptografischen Echtheitssiegel. KI-generierte Videos könnten verpflichtend mit solchen Metadaten versehen werden. Wer mit Datenintegrität vertraut ist, erkennt das Prinzip sofort: Es ist im Grunde eine Checksumme für die Wahrheit.
Medienkompetenz als Pflichtfach: Kinder und Jugendliche müssen lernen, Quellen zu hinterfragen, bevor sie Inhalte teilen. Das ist keine Frage der Technik, sondern der Bildung.
Fazit: Vertrauen als knappes Gut
Die Geschichte der Video-Deepfakes illustriert exemplarisch, was es bedeutet, wenn eine Technologie schneller wächst als das gesellschaftliche Bewusstsein für ihre Konsequenzen.
Das Internet der Zukunft wird kein neutrales Medium mehr sein, in dem man Videos einfach glaubt. Vertrauen wird zur aktiv erworbenen, technisch gestützten Kompetenz. Genau wie in der Datenspeicherung die Integrität von Daten nicht einfach vorausgesetzt, sondern durch Prüfmechanismen – Checksummen, RAID, kryptografische Signaturen – aktiv abgesichert werden muss, so wird auch die Authentizität von Medien künftig technischer Absicherung bedürfen.
Die fundamentale Lektion bleibt dieselbe wie beim Audio-Deepfake: In einer Welt, in der Gesichter und Stimmen synthetisiert werden können, muss Vertrauen auf mehreren Säulen ruhen. Kritisches Hinterfragen ist vom optionalen Skeptizismus zur essentiellen Kompetenz geworden.
Pandoras Büchse ist auch hier längst geöffnet. Die Frage ist nicht mehr, ob wir mit dieser Technologie leben müssen. Die Frage ist, wie gut wir uns darauf vorbereiten.
Dieser Artikel ist Teil einer Serie über Künstliche Intelligenz – zwischen Faszination und Verantwortung.
--------------------------------------------------------------------------------------------
"In der Verordnung (EU) 2024/1689 (KI-Verordnung) werden Deepfakes als „einen durch KI erzeugten oder manipulierten Bild-, Ton- oder Videoinhalt, der wirklichen Personen, Gegenständen, Orten, Einrichtungen oder Ereignissen ähnelt und einer Person fälschlicherweise als echt oder wahrheitsgemäß erscheinen würde“ definiert.[4]"