Audio und Video nativ in einem Ablauf
Kling 2.6 ist in diesem Versionscluster die klarste Seite für Nutzer, die Bild, Stimme und Soundeffekte direkt gemeinsam erzeugen wollen, statt sie später zusammenzufügen.

Mit Kling 2.6 erstellst du kurze KI-Videos mit Bild, Stimme und Ton in einem gemeinsamen Arbeitsablauf für Kreationen, die von Text oder Bild ausgehen.
Kling 2.6 Ablaufbereich
Wähle zuerst den Kurzformat-Ablauf und schreibe dann eine knappe Beschreibung, die Bild, Stimme und Umgebungsgeräusche zusammenführt.

Ablaufvorschau
BereitIdeal für kurze Anzeigen, die auf Anweisungen basieren und Erzählstimme, Szenenton und Bild in einem Durchgang erzeugen sollen.
Aktive Beschreibung
Erstelle einen 10-Sekunden-Snack-Spot: helle Küche, energische weibliche Stimme, kurzer Slogan, sanfte Hintergrundmusik und am Ende ein schneller Packshot.
Am 5. Dezember 2025 kündigte Kuaishou an, dass Kling AI das Modell Kling Video 2.6 bereits am 3. Dezember 2025 veröffentlicht hatte. Offiziell führte Kling 2.6 die gleichzeitige audiovisuelle Generierung ein und verbesserte sowohl textbasierte als auch bildbasierte Abläufe. Laut Veröffentlichung können Nutzer Bild, Sprecherstimme, Soundeffekte und Umgebungsgeräusche in einem Durchgang erzeugen, mit Sprachgenerierung auf Chinesisch und Englisch und Videos bis zu 10 Sekunden. Damit ist Kling 2.6 besonders interessant für Creators, die Audio und Video gemeinsam erzeugen möchten, statt mit stummem Material zu beginnen.

Kling 2.6 ist in diesem Versionscluster die klarste Seite für Nutzer, die Bild, Stimme und Soundeffekte direkt gemeinsam erzeugen wollen, statt sie später zusammenzufügen.
Die offizielle 2.6-Veröffentlichung positioniert das Modell klar rund um audiovisuelle Abläufe aus Text und Bild und macht es damit leichter, breitere kreative Prozesse anzusprechen.
Die offizielle Beschreibung zu Kling 2.6 hebt eine engere audiovisuelle Koordination, stärkeres semantisches Verständnis und eine natürlichere Verbindung zwischen Bewegung und Ton hervor.

Kurze Werbespots mit Erzählstimme, Dialog und Soundeffekten
Social-Videos mit integrierter Stimme und Umgebungsgeräuschen
Produktvideos mit Erstellung aus Bild und Audio
Kurze Creator-Videos, bei denen das Audiotiming wichtig ist
E-Commerce-Videos, die eine schnellere Audio-und-Video-Produktion brauchen
01
Halte Stimmstil, Dialog und Umgebungsgeräusche in getrennten kurzen Phrasen, damit die Anweisung leicht verständlich bleibt.
02
Kling 2.6 ist am besten für kurze Videos geeignet, daher solltest du kurze Erzähltexte oder Dialoge statt langer Skripte verwenden.
03
Bei Anfragen, die von einem Bild ausgehen, solltest du Bewegung und Klangstimmung gemeinsam beschreiben, damit die Szene stimmiger wirkt.
Nutze diese verwandten Seiten, um Kling 2.6 mit früheren Versionen und angrenzenden Video-Abläufen zu vergleichen.
Nutze Kling 2.6, wenn du kurze audiovisuelle Videos in einem klareren Ablauf erstellen willst.