Google Veo 3.1
Google Veo 3.1 je model od Google DeepMind na generovanie videa, ktorý vie spolu s obrazom generovať aj natívny zvuk (ambient, efekty a dokonca dialóg). Použiť ho môžeš cez aplikáciu Gemini, Flow aj programovo cez Gemini API.
1. Čo to je a prečo je to podstatné
Pri AI videu bol zvuk doteraz často „druhý krok“ (doliepanie v editore). Veo 3.1 ho tlačí priamo do generovania – a to mení workflow.
Kto za tým stojí: Google DeepMind (modelová rodina Veo).
Čo to rieši: krátke videá (typicky 8 sekúnd) s vyššou kontrolou a so zvukom, aby si nemusel robiť polovicu práce v postprodukcii.
Pre koho to je: tvorcovia obsahu, marketéri, ale aj dev tímy, ktoré chcú generovať kreatívu programovo (A/B testy reklám).
Prečo je to podstatné: video sa stáva „promptovateľným assetom“ – zadáš zámer, štýl, scénu a zvukové cue a dostaneš hotový klip.
2. Technické detaily
Google zverejňuje pomerne konkrétne parametre pre použitie v Gemini API, vrátane model kódov, limitov a funkcií (reference images, aspect ratio, predĺženie videa).
Dĺžka a rozlíšenie: 8-sekundové video v 720p/1080p/4k (1080p/4k pre 8s režim).
Zvuk: „video with audio“ – zvuk sa generuje natívne spolu s obrazom.
Vstupy: text a obrázky; pre Veo 3.1 sú dostupné aj reference images (do 3) a „first/last frame“ kontrola.
Aspect ratio: 16:9 a 9:16 (praktické pre Shorts/Reels).
Model varianty (API): Veo 3.1 Preview (
veo-3.1-generate-preview) a Veo 3.1 Fast Preview (veo-3.1-fast-generate-preview).
Kľúčové parametre (praktický prehľad)
| Parameter | Hodnota |
|---|---|
| Typický klip | 8 sekúnd |
| Rozlíšenie | 720p / 1080p / 4k (8s režim) |
| Zvuk | Natívne generovaný audio track |
| Vstup | Text, Image; reference images (do 3) |
| Aspect ratio | 16:9 alebo 9:16 |
| Model kódy (Gemini API) | veo-3.1-generate-preview, veo-3.1-fast-generate-preview |
3. Dostupnosť
Veo 3.1 nie je len „jeden web“, ale viac vstupných brán podľa toho, či si tvorca alebo vývojár.
Gemini app: generovanie videa cez Gemini (spotrebiteľský vstup).
Flow: nástroj na tvorbu AI videí/filmmaking workflow.
Gemini API: programové generovanie videí (vrátane model verzií Veo 3.1).
Ďalšie kanály: Google uvádza aj YouTube Shorts, Vertex AI a Google Vids (podľa rollout-u).
Regionálne obmedzenia: môžu sa líšiť podľa produktu a krajiny (typické pri generatívnom videu).
4. Ceny / Licencie
Tu sa oplatí odlíšiť „tvorca“ vs. „developer“.
Google AI plány (spotrebiteľ): Flow komunikuje plán Pro (cca $19.99/mes.) a Ultra (cca $249.99/mes.), plus aj bezplatnú možnosť s mesačnými kreditmi (napr. 180).
Rozdiel Fast vs. plná verzia: v spotrebiteľských plánoch sa často páruje „Fast“ pre rýchlejšie generovanie, a „plná“ verzia pre vyššiu kvalitu (presný mapping sa môže meniť podľa rollout-u).
API pricing: pri Gemini API/Vertex AI sa ceny riadia oficiálnym cenníkom (mení sa a závisí od regiónu a variantu) – cenník je dostupný na oficiálnych stránkach.
5. Bezpečnosť a súkromie
Pri videu je bezpečnosť aj o tom, aby sa dalo spätne zistiť, že ide o AI.
Watermarking: Veo výstupy sú watermarked cez SynthID; v Gemini app sa uvádza aj viditeľný watermark + SynthID.
Retencia v API: v Gemini API sa generované videá ukladajú na serveri približne 2 dni – ak chceš lokálnu kópiu, musíš si ju stiahnuť včas.
Safety filtre: generované videá prechádzajú safety filtrami; pri bloknutí generovania (napr. kvôli audio) sa podľa dokumentácie nemá účtovať generácia.
Praktické odporúčania:
Nedávaj citlivé podklady: najmä pri reference images (produkt, tvár, branding) si ujasni, čo môžeš posielať do cloudu.
Rieš práva: zvuk (dialóg) môže zvádzať k „napodobňovaniu“ – drž sa vlastných textov a bezpečných scenárov.
Disclosure: ak video používaš verejne, rátaj s tým, že SynthID môže byť detegovateľný.
6. Praktické tipy / Kedy to použiť
Veo 3.1 je najlepší vtedy, keď mu dáš jasné filmárske inštrukcie, nie len „vymysli niečo“.
Promptuj ako režisér: uhol kamery, pohyb, objektív, svetlo, atmosféra, tempo strihu.
Zvuk píš explicitne: rozdeľ na ambient, SFX a dialóg (kto hovorí, tón, vzdialenosť).
Použi reference images: keď chceš konzistenciu postavy/produktu naprieč klipmi, referencie sú často rozdiel medzi „použiteľné“ a „len pekné“.
Vertikál je legit: 9:16 dáva zmysel pre Shorts/Reels, netreba to potom násilne cropovať.
Kedy nie: keď potrebuješ dlhý naratív v jednom kuse – Veo je primárne krátky klip, dlhší príbeh skladáš z viacerých generácií.
Zhrnutie
Google Veo 3.1 je video model so zvukom generovaným natívne, čo šetrí postprodukciu.
V API má konkrétne model verzie (Preview/Fast), podporuje reference images, 9:16 a viac rozlíšení pre 8-sekundové klipy.
Dostupnosť ide cez Gemini app, Flow a programovo cez Gemini API; podľa rollout-u aj cez ďalšie Google kanály.
Z pohľadu dôveryhodnosti a bezpečnosti rátaj so SynthID watermarkingom a s tým, že v API sa výstupy na serveri držia len obmedzený čas.