Google Veo 3.1

Google Veo 3.1 je model od Google DeepMind na generovanie videa, ktorý vie spolu s obrazom generovať aj natívny zvuk (ambient, efekty a dokonca dialóg). Použiť ho môžeš cez aplikáciu Gemini, Flow aj programovo cez Gemini API.


1. Čo to je a prečo je to podstatné

Pri AI videu bol zvuk doteraz často „druhý krok“ (doliepanie v editore). Veo 3.1 ho tlačí priamo do generovania – a to mení workflow.

  • Kto za tým stojí: Google DeepMind (modelová rodina Veo).

  • Čo to rieši: krátke videá (typicky 8 sekúnd) s vyššou kontrolou a so zvukom, aby si nemusel robiť polovicu práce v postprodukcii.

  • Pre koho to je: tvorcovia obsahu, marketéri, ale aj dev tímy, ktoré chcú generovať kreatívu programovo (A/B testy reklám).

  • Prečo je to podstatné: video sa stáva „promptovateľným assetom“ – zadáš zámer, štýl, scénu a zvukové cue a dostaneš hotový klip.


2. Technické detaily

Google zverejňuje pomerne konkrétne parametre pre použitie v Gemini API, vrátane model kódov, limitov a funkcií (reference images, aspect ratio, predĺženie videa).

  • Dĺžka a rozlíšenie: 8-sekundové video v 720p/1080p/4k (1080p/4k pre 8s režim).

  • Zvuk: „video with audio“ – zvuk sa generuje natívne spolu s obrazom.

  • Vstupy: text a obrázky; pre Veo 3.1 sú dostupné aj reference images (do 3) a „first/last frame“ kontrola.

  • Aspect ratio: 16:9 a 9:16 (praktické pre Shorts/Reels).

  • Model varianty (API): Veo 3.1 Preview (veo-3.1-generate-preview) a Veo 3.1 Fast Preview (veo-3.1-fast-generate-preview).

Kľúčové parametre (praktický prehľad)

Parameter Hodnota
Typický klip 8 sekúnd
Rozlíšenie 720p / 1080p / 4k (8s režim)
Zvuk Natívne generovaný audio track
Vstup Text, Image; reference images (do 3)
Aspect ratio 16:9 alebo 9:16
Model kódy (Gemini API) veo-3.1-generate-preview, veo-3.1-fast-generate-preview

3. Dostupnosť

Veo 3.1 nie je len „jeden web“, ale viac vstupných brán podľa toho, či si tvorca alebo vývojár.

  • Gemini app: generovanie videa cez Gemini (spotrebiteľský vstup).

  • Flow: nástroj na tvorbu AI videí/filmmaking workflow.

  • Gemini API: programové generovanie videí (vrátane model verzií Veo 3.1).

  • Ďalšie kanály: Google uvádza aj YouTube Shorts, Vertex AI a Google Vids (podľa rollout-u).

  • Regionálne obmedzenia: môžu sa líšiť podľa produktu a krajiny (typické pri generatívnom videu).


4. Ceny / Licencie

Tu sa oplatí odlíšiť „tvorca“ vs. „developer“.

  • Google AI plány (spotrebiteľ): Flow komunikuje plán Pro (cca $19.99/mes.) a Ultra (cca $249.99/mes.), plus aj bezplatnú možnosť s mesačnými kreditmi (napr. 180).

  • Rozdiel Fast vs. plná verzia: v spotrebiteľských plánoch sa často páruje „Fast“ pre rýchlejšie generovanie, a „plná“ verzia pre vyššiu kvalitu (presný mapping sa môže meniť podľa rollout-u).

  • API pricing: pri Gemini API/Vertex AI sa ceny riadia oficiálnym cenníkom (mení sa a závisí od regiónu a variantu) – cenník je dostupný na oficiálnych stránkach.


5. Bezpečnosť a súkromie

Pri videu je bezpečnosť aj o tom, aby sa dalo spätne zistiť, že ide o AI.

  • Watermarking: Veo výstupy sú watermarked cez SynthID; v Gemini app sa uvádza aj viditeľný watermark + SynthID.

  • Retencia v API: v Gemini API sa generované videá ukladajú na serveri približne 2 dni – ak chceš lokálnu kópiu, musíš si ju stiahnuť včas.

  • Safety filtre: generované videá prechádzajú safety filtrami; pri bloknutí generovania (napr. kvôli audio) sa podľa dokumentácie nemá účtovať generácia.

  • Praktické odporúčania:

    • Nedávaj citlivé podklady: najmä pri reference images (produkt, tvár, branding) si ujasni, čo môžeš posielať do cloudu.

    • Rieš práva: zvuk (dialóg) môže zvádzať k „napodobňovaniu“ – drž sa vlastných textov a bezpečných scenárov.

    • Disclosure: ak video používaš verejne, rátaj s tým, že SynthID môže byť detegovateľný.


6. Praktické tipy / Kedy to použiť

Veo 3.1 je najlepší vtedy, keď mu dáš jasné filmárske inštrukcie, nie len „vymysli niečo“.

  • Promptuj ako režisér: uhol kamery, pohyb, objektív, svetlo, atmosféra, tempo strihu.

  • Zvuk píš explicitne: rozdeľ na ambient, SFX a dialóg (kto hovorí, tón, vzdialenosť).

  • Použi reference images: keď chceš konzistenciu postavy/produktu naprieč klipmi, referencie sú často rozdiel medzi „použiteľné“ a „len pekné“.

  • Vertikál je legit: 9:16 dáva zmysel pre Shorts/Reels, netreba to potom násilne cropovať.

  • Kedy nie: keď potrebuješ dlhý naratív v jednom kuse – Veo je primárne krátky klip, dlhší príbeh skladáš z viacerých generácií.


Zhrnutie

  • Google Veo 3.1 je video model so zvukom generovaným natívne, čo šetrí postprodukciu.

  • V API má konkrétne model verzie (Preview/Fast), podporuje reference images, 9:16 a viac rozlíšení pre 8-sekundové klipy.

  • Dostupnosť ide cez Gemini app, Flow a programovo cez Gemini API; podľa rollout-u aj cez ďalšie Google kanály.

  • Z pohľadu dôveryhodnosti a bezpečnosti rátaj so SynthID watermarkingom a s tým, že v API sa výstupy na serveri držia len obmedzený čas.