Vor zwei Jahren war KI-Video noch ein Partytrick: schräge Gesichter, ruckelige Bewegungen, Ton, der nie zum Bild passte. 2026 sieht das komplett anders aus. Die grossen Labs haben massiv nachgelegt, und plötzlich jonglierst du nicht mehr fünf einzelne Tools, sondern arbeitest in durchgängigen Pipelines. Für mein und dein Unternehmen heisst das: mehr Content, schneller produziert, aber auch neue Fallstricke bei Kosten und Qualität. Hier kommen unsere 10 Tipps, wie du 2026 wirklich davon profitierst, ohne hoffentlich im Credit-Dschungel zu versinken.
Tipp 1
Skript und Charaktere zuerst, Bewegtbild zuletzt
Der grösste Anfängerfehler: direkt einen Videoprompt schreiben. Bau dir zuerst ein Charakter- und Prop-Sheet mit GPT Image 2 (offiziell ChatGPT Images 2.0 von OpenAI). Eine Referenztafel mit Gesicht, Outfit und Requisiten aus verschiedenen Winkeln sorgt dafür, dass euer Mascot, Sprecher oder Produkt in jeder Szene gleich aussieht. Ohne dieses Sheet driftet die KI nach drei, vier Clips garantiert ab: andere Nase, andere Farbe, anderes Outfit.
Tipp 2
Ein Modell für (fast) alles: Gemini Omni Flash
Google hat mit Gemini Omni Flash Text, Bild, Ton und Video in ein einziges Modell gepackt. Du beschreibst eine Szene, bekommst einen bis zu 10 Sekunden langen Clip mit synchronem Ton, und kannst danach einfach weiterchatten: «mach das Licht wärmer», «dreh die Kamera etwas nach links». Für schnelle Social-Media-Snippets brauchst du damit oft kein zweites Tool mehr, für den Feinschliff später schon.
Tipp 3
Seedance 2.0 fürs Feinschliff-Video
Wenn’s ernst wird und der Clip auf die Website oder in ein Kundenmeeting soll, lohnt sich der Wechsel auf Seedance 2.0. Das Modell rechnet Physik und Bewegung sauberer als die meisten Konkurrenten und liefert synchronisierten Ton direkt mit. Fahr im günstigen Fast-Modus vor, sobald Idee und Kamera stimmen, und render die finale Fassung erst im teureren Pro-Modus. Details zur Preisstruktur findest du beim Anbieter.
Tipp 4
Higgsfield Supercomputer als Regisseur
Higgsfield Supercomputer ist im Grunde ein digitaler Producer im Chatfenster. Du schreibst «mach mir 10 Ad-Varianten für unser neues Produkt», und das System plant Skript, Charaktere, Szenen und Musik selbständig, inklusive Kostenvoranschlag, bevor überhaupt gerendert wird. Praktisch für Agenturen und grössere Kampagnen. Aber Vorsicht: Wer nicht aufpasst, lässt den Agenten unbemerkt durchs ganze Kreditbudget rennen.
Tipp 5
Stimme, Musik und Lipsync aus einer Pipeline
ElevenLabs Flows verbindet Bild, Video, Sprache, Musik und Lipsync auf einer einzigen Arbeitsfläche. Du ziehst die Ausgabe eines Bild-Knotens in einen Video-Knoten, hängst eine Stimme und einen Soundtrack an, fertig. Ändert sich nur das Skript, musst du nicht die ganze Pipeline neu rendern, sondern nur den betroffenen Knoten. Für mehrsprachige Kampagnen ein enormer Zeitgewinn.
Tipp 6
Claude Konnektoren steuern gleich die ganze Pipeline
Der unsexy, aber wichtigste Tipp: Claude Konnektoren sind mehr als nur ein Zugang zu Google Drive oder Slack für dein Briefing. Über MCP (Model Context Protocol), einen offenen Standard, der KI-Modellen den direkten Zugriff auf externe Tools erlaubt, lassen sich auch Higgsfield und ElevenLabs an Claude anbinden. Das heisst konkret: Du beschreibst in einem Satz, was du willst, und Claude schreibt selbst den passenden Prompt fürs jeweilige Tool, statt dass du jedes Mal von Hand in Higgsfield oder ElevenLabs herumtippst.
Mit Claude Code lässt sich das Ganze sogar in einem eigenen Projektordner auf deinem Desktop organisieren: Claude generiert die Clips und Voiceovers über die angebundenen Tools und lädt dir die fertigen Dateien direkt in diesen Ordner herunter. Für Briefing, Markenrichtlinien und Referenzbilder verbindest du Claude zusätzlich einmal mit Google Drive, Notion oder Slack, dann holt sich die KI den Kontext künftig selber. Weniger Copy-Paste, konsistentere Ergebnisse über alle Kanäle und Tools hinweg.
Tipp 7
Rechne in Credits, nicht in Minuten
Fast jedes Tool rechnet heute in Credits statt in Franken pro Minute. Ein kurzer Clip in niedriger Auflösung kostet oft nur einen Bruchteil der 1080p- oder 4K-Version. Arbeite deshalb immer nach dem Muster Entwurf, Feinschliff, Endversion: Erst günstig und schnell testen, erst beim letzten Rendering die teure, hochauflösende Stufe wählen. Das spart im Alltag schnell 60 bis 80 Prozent der Kosten.
Tipp 8
Zwei realistische Kostenbeispiele (Schätzung, Stand Sommer 2026)
Beispiel 1: 30-Sekunden-Recruiting-Reel für Social Media
- Charakter- und Prop-Sheets mit GPT Image 2: rund CHF 2
- 4 Clips à 8 Sekunden mit Seedance 2.0 (Entwurf im Fast-Modus, Finalrender im Pro-Modus): rund CHF 15 bis 20
- Voiceover und Hintergrundmusik über ElevenLabs Flows: rund CHF 5 bis 8
- Total reine KI-Kosten: etwa CHF 25 bis 30, plus 3 bis 4 Stunden Prompting und Feinschliff
Nicht eingerechnet ist die Kommunikation mit dem Kunden oder deiner Vorgesetzten für Änderungswünsche. «Kannst du das Logo grösser machen» oder «der Ton passt noch nicht ganz» kann den Aufwand schnell verdoppeln, und genau das übernimmt aktuell noch keine KI für dich.
Beispiel 2: 60-Sekunden-Produktvideo in drei Sprachversionen
- Higgsfield Supercomputer für Planung und Szenen-Varianten: rund CHF 60 bis 90 (anteilig am Monatsabo)
- Seedance 2.0 Pro für 6 Szenen à 10 Sekunden: rund CHF 25 bis 35
- ElevenLabs Flows für Voiceover und Lipsync in drei Sprachen: rund CHF 15 bis 20
- GPT Image 2 für Produktvarianten in 4K: rund CHF 3 bis 5
- Total reine KI-Kosten: etwa CHF 100 bis 150, plus Planungs- und Review-Zeit
Diese Zahlen sind Schätzungen auf Basis aktueller Anbieterpreise und können je nach Guthabenpaket, Region und Kursverlauf schwanken.
Tipp 9
Wo KI (noch) nicht hinkommt
Ehrlich gesagt: Für authentische Videos mit echten Menschen aus deinem Unternehmen, deinem Team, deiner Geschäftsleitung, deinen Kundinnen im Testimonial, ist der Aufwand mit KI aktuell noch viel zu gross, und das Resultat bleibt oft unbefriedigend. Mimik, kleine Unregelmässigkeiten in der Stimme, die Art, wie jemand tatsächlich lacht, all das macht einen Menschen glaubwürdig, und genau das kriegt eine KI 2026 immer noch nicht zuverlässig hin, ohne dass es leicht künstlich wirkt.
Für solche Aufnahmen setzt du deshalb besser auf eine echte Videoproduktion wie die von Video & Photoworkers.ch in Winterthur. KI kann ergänzend eingesetzt werden, für B-Roll, Erklärgrafiken oder zusätzliche Sprachversionen, aber nicht als Ersatz für den Auftritt deines Teams vor der Kamera. Schliesslich willst du bei deinen Kundinnen und Kunden keinen «KI-Fake»-Eindruck hinterlassen. Und deine Mitarbeitenden mit einem KI-Klon zu kopieren, statt sie wirklich vor die Kamera zu holen, wirkt schnell wie Geringschätzung statt Wertschätzung. Wie wir das als Fotografen und Videografen grundsätzlich sehen, haben wir übrigens schon einmal ehrlich aufgeschrieben.
Tipp 10
Kennzeichnung und Vertrauen nicht vergessen
Google markiert Omni-Videos automatisch mit SynthID, OpenAI tagt Bilder als KI-generiert, und in der EU gilt seit August 2026 eine Kennzeichnungspflicht für KI-Inhalte, die auch für Schweizer Unternehmen mit EU-Publikum relevant werden kann. Wir haben das im Detail in unserem Artikel zu Bildrechten bei Mitarbeiterporträts aufgearbeitet. Sag deinen Kundinnen und Kunden ehrlich, was von der KI stammt und was echt gefilmt wurde, das schützt eure Glaubwürdigkeit.
Deine Checklisten für den Alltag
Checkliste für den Start in die KI-Videoproduktion
Checkliste: Passt KI-Video für dein Unternehmen, oder brauchst du einen Profi?
Fazit und dein nächster Schritt
Du willst KI-Video und echte Studioaufnahmen sinnvoll kombinieren, ohne selber sechs Tools lernen zu müssen? Wir bei Video & Photoworkers.ch in Winterthur verbinden beides: professionelle Aufnahmen in unserem Mietstudio und die aktuellen KI-Pipelines für alles, was drumherum passiert. Jetzt unverbindlich anfragen, und wir zeigen dir, was für dein Unternehmen realistisch Sinn macht.