Tech & Trends KI, Kamera, Kreativität: Wie Google mit Veo 3 das Game der Videoproduktion neu schreibt

Foto: Gemini

20. Mai 2025

Foto: Gemini

KI, Kamera, Kreativität: Wie Google mit Veo 3 das Game der Videoproduktion neu schreibt

Autor*in

Max Anzile

Seite 1 / 2

Mit Veo 3 hat Google ein neues Kapitel in der KI-gestützten Videoproduktion aufgeschlagen. Das Tool generiert realistische, vertonte Videos in 4K – aus einem einzigen Prompt. Was das bedeutet, wie es funktioniert und was Unternehmen jetzt wissen müssen.

Was ist Veo 3?

Google Veo 3 ist ein KI-Modell zur Text-zu-Video-Generierung, das im Mai 2025 auf der Google I/O vorgestellt wurde. Es gehört zur neuen Generation multimodaler KI-Tools, die nicht nur Bilder oder Code, sondern ganze audiovisuelle Erlebnisse erzeugen können – vollständig aus Spracheingaben.

Im Vergleich zu anderen Videomodellen wie OpenAIs Sora oder Runways Gen-4 setzt Veo 3 neue Maßstäbe in drei Bereichen:

Native Tonerzeugung (Soundeffekte, Musik, gesprochene Sprache)
Visuelle Qualität bis 4K
Präzise Steuerung durch natürliche Sprache

Das Tool richtet sich gleichermaßen an Kreativprofis, Content-Teams und Unternehmen, die ihre Produktionsprozesse skalieren und flexibilisieren wollen.

So funktioniert Veo 3 in der Praxis

1. Zugang

Aktuell ist Veo 3 verfügbar über:

Gemini Ultra (Premium-Account für Endnutzer, derzeit nur in den USA)
Flow (Googles KI-Filmmaking-Plattform)
Vertex AI (Enterprise-Plattform mit API-Zugang)

Die Nutzung erfordert einen Google-Account mit entsprechender Berechtigung. Für Unternehmen empfiehlt sich die Integration über Vertex AI, da hier auch Datenschutz- und Workflow-Kontrollen möglich sind.

2. Prompting

Veo 3 wird vollständig über Texteingaben gesteuert. Je präziser der Prompt, desto genauer das Ergebnis.

Beispiel-Prompts:

„Zwei Personen diskutieren bei Sonnenuntergang auf einem Balkon, leise Musik im Hintergrund. Kamera fährt langsam zurück.“
„Ein Roboter läuft durch eine verlassene Industriestadt, begleitet von Windgeräuschen und entfernten Sirenen. Dunkle Farbpalette, statische Kamera.“

Wichtig: Neben Handlung und Umgebung lassen sich auch Kameraperspektiven, Lichtstimmungen, Stilreferenzen und Audiomerkmale definieren.

Seite 1 / 2

Nächste Seite

Blick ins Heft

4/2025

Die neue Ausgabe 4/2025