Zum Inhalt springen

Google stellt Gemini Omni Flash vor: KI-Modell für Video-Generierung und -Bearbeitung

Auf den Punkt: Gemini Omni Flash ermöglicht Video-Generierung und -Bearbeitung durch Gespräche in natürlicher Sprache mit konsistenten Charakteren, realistischer Physik und mehreren Bearbeitungsrunden.

Google hat Gemini Omni Flash präsentiert, ein Modell, das aus beliebigen Eingaben hochwertige Videos generiert und durch natürlichsprachliche Befehle bearbeitet. Das System kombiniert Bild-, Audio-, Video- und Texteingaben und nutzt dabei Geminis Wissen über die reale Welt.

Google hat die erste Version der Omni-Modellfamilie – Gemini Omni Flash – eingeführt. Das System wird derzeit in der Gemini-App, Google Flow und YouTube Shorts ausgerollt. Im weiteren Verlauf sollen auch Ausgabeformate wie Bild und Audio unterstützt werden.

Das Modell erlaubt es, Videos durch natürlichsprachliche Anweisungen zu bearbeiten, wobei Änderungen aufeinander aufbauen und Charakterkonsistenz, physikalische Korrektheit sowie Szenenkontinuität erhalten bleiben. Nutzer können bestimmte Elemente verändern oder komplette Szenen umgestalten – etwa um Objekte hinzuzufügen, Aktionen zu verändern oder einen aufgenommenen Moment völlig umzudeuten. Bearbeitungen sind über mehrere Durchläufe möglich, ohne den ursprünglichen Szenenzusammenhang zu verlieren.

Ein Kernmerkmal ist Geminis physikalisches Verständnis: Das Modell verarbeitet Kräfte wie Schwerkraft, Trägheit und Fluiddynamik mit verbesserter Intuition. Gleichzeitig verbindet es dieses physikalische Wissen mit Geminis Kenntnissen in Geschichte, Naturwissenschaften und kulturellem Kontext, um szenische Darstellungen sinnvoll mit Storytelling zu verbinden.

Nutzer können beispielsweise ein Video als Ausgangspunkt transformieren: einen Geiger in eine andere Umgebung versetzen, Instrumente unsichtbar machen oder Kameraperspektiven ändern – alles durch Konversation. Das System kombiniert dabei Eingaben aus Bildern, Audio, Video und Text zu kohärenten Ausgaben, die auf Geminis Weltverständnis basieren.


Quelle: ainews-dev.lumi-systems.io · Erschienen 20. Mai 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.5.2.

Share on: