Gemma 4
Gemma 4 je rodina otvorených jazykových modelov od Google DeepMind, vydaná 2. apríla 2026 pod licenciou Apache 2.0. Je to skutočne otvorená rodina modelov – od miniatúrnych variantov pre mobilné zariadenia až po serverové veľkosti – a všetky sú dostupné na komerčné nasadenie bez poplatkov za licenciu.
1. Čo prináša Gemma 4 – prehľad
Štyri veľkostné varianty, každý s
base(predtrénovaný) ait(instruction-tuned) verziou:Gemma 4 1B — zariadenia na hrane (IoT, smartfóny), vyžaduje ~2 GB RAM
Gemma 4 4B — notebooky a jednoduché desktopy (CPU/GPU, 8–16 GB RAM)
Gemma 4 12B — pracovné stanice s GPU (24 GB VRAM, napr. RTX 4090)
Gemma 4 27B — serverové prostredie, viac GPU alebo výkonná GPU karta (A100/H100)
Multimodálna podpora — od variantu 12B vyššie modely zvládajú aj vstup obrázkov (vision), nielen text
Trénovacia metodika — Google neposkytol úplné detaily (výcvikové dáta, RLHF pipeline, veľkosť trénovacej sady), čo je bežné aj pre iné open-weight modely; dostupné sú len orientačné informácie o architektúre
(Gemma 4 je priamy nástupca rodiny Gemma 2 a Gemma 3, pričom 27B variant je konkurentom Mistral Large a Llama 3.3 70B v testoch kvality.)
2. Apache 2.0 vs. Llama licencia – prečo na tom záleží
Toto je kľúčový bod pre slovenské a európske firmy:
Apache 2.0 (Gemma 4, Mistral Medium 3)
bezpodmienečné komerčné použitie – bez obmedzení obratu ani počtu používateľov
modifikácia a redistribúcia povolená s uvedením pôvodu
žiadne „use policy" addendum – platí štandardná open-source licencia
kompatibilné s väčšinou firemných právnych oddelení
Llama licencia (Meta Llama 3.x)
obsahuje vlastné „Acceptable Use Policy" a „Meta Llama 3 Community License"
firmy s viac ako 700 miliónmi MAU potrebujú osobitný súhlas Meta
redistribúcia derivátov vyžaduje zachovanie „Llama" v názve produktu
pri niektorých komerčných použitiach je nutná registrácia
Praktický dopad pre SK/CZ firmy:
Gemma 4 a Apache 2.0 modely možno embeddovať do produktov, predávať ako súčasť SaaS, alebo použiť v regulovaných odvetviach (finančné, zdravotnícke) bez právnych komplikácií
Pri Llama modeloch je odporúčaná konzultácia s právnikom, najmä ak produkt mieri na globálny trh
3. Pozícia na trhu – Gemma 4 vs. konkurencia
| Model | Parametre | Licencia | Multimodál | Poznámka |
|---|---|---|---|---|
| Gemma 4 27B | 27B | Apache 2.0 | ✓ (12B+) | Google DeepMind |
| Llama 3.3 70B | 70B | Meta Custom | ✗ | Meta, výkonný |
| Qwen3 32B | 32B | Apache 2.0 | čiastočne | Alibaba |
| Mistral Medium 3 | ~70B | Apache 2.0 | ✗ | EU compliance |
Výhoda Gemma 4: Google ekosystém (Vertex AI, Google Cloud), kvalitná kvantizácia, širší hardvérový rozsah
Nevýhoda Gemma 4: Google nezverejnil detaily trénovania, čo sťažuje audit pre regulované prostredia
Qwen3 od Alibaba je vnímaný ako silný rival v kódovaní a matematike, ale má čínsky pôvod (potenciálna compliance obava pre EU firmy)
4. Multimodálne schopnosti (12B a 27B)
Gemma 4 12B a 27B zvládajú obrázkový vstup — popis obrázkov, OCR-like úlohy, analýza grafov
Výstup zostáva textový (nejde o generovanie obrázkov)
V praxi použiteľné pre:
analýzu dokumentov so skenovaným obsahom
opis produktových obrázkov v e-commerce
vizuálne QA (otázky o obsahu fotky)
(Multimodálna podpora v 1B a 4B variantoch nie je k dispozícii – cielené na čisto textové use-case.)
5. Kvantizovaie – Q4 vs. Q8 v praxi
Kvantizácia znižuje veľkosť modelu a pamäťové nároky na úkor presnosti:
Q8 (8-bit) — minimálna strata kvality, odporúčané ak máte dostatočnú VRAM
Gemma 4 12B v Q8: ~12 GB VRAM
Gemma 4 27B v Q8: ~27 GB VRAM (potrebné viac GPU alebo veľká karta)
Q4 (4-bit) — polovičná veľkosť, merateľná strata na dlhých a zložitých úlohách
Gemma 4 12B v Q4: ~6–7 GB VRAM (zmestí sa na RTX 3060/4060)
Gemma 4 27B v Q4: ~14–16 GB VRAM (RTX 4090 zvládne)
Odporúčanie: pre produkčné nasadenie Q8 alebo Q6, pre experimentovanie/prototypy Q4 postačí
GGUF formát (pre llama.cpp a Ollama) podporuje aj hybridné kvantizovania ako Q5_K_M – dobrý kompromis medzi veľkosťou a kvalitou
6. Ako spustiť Gemma 4 lokálne
Ollama – najjednoduchšia cesta pre jednotlivcov a tímy:
ollama pull gemma4:12b
ollama run gemma4:12b
# Instruction-tuned variant (pre chat)
ollama pull gemma4:27b-it
ollama run gemma4:27b-it
llama.cpp – pre maximálnu kontrolu a CPU inferenčné nasadenie:
./llama-cli -m gemma-4-12b-q8_0.gguf -p "Vysvetli mi kvantizovaie LLM" -n 512
vLLM – pre serverové nasadenie s OpenAI-kompatibilným API:
python -m vllm.entrypoints.openai.api_server \
--model google/gemma-4-27b-it \
--dtype bfloat16
(API ID na Hugging Face Hub: google/gemma-4-1b, google/gemma-4-4b, google/gemma-4-12b, google/gemma-4-27b — s príponou -it pre instruction-tuned varianty.)
Google AI Studio / Vertex AI — cloudová alternatíva pre tímy bez vlastného GPU servera
7. EU AI Act a open-weight modely
Gemma 4 vstupuje na trh v čase, keď sa EU AI Act prakticky uplatňuje:
GPAI (General Purpose AI) pravidlá sú v plnej sile od augusta 2025
modely s viac ako 10^25 FLOP trénovania podliehajú rozšíreným povinnostiam (systémové riziká)
Google musí zverejniť základné informácie o trénovaní (abstraktná úroveň)
Apache 2.0 ≠ úplná zodpovednosť na Google — pri nasadení Gemma 4 vo vašom produkte ste vy prevádzkovateľom a váš systém podlieha klasifikácii rizika podľa use-case
Prakticky: nasadenie Gemma 4 na HR screening alebo medicínske rozhodovanie = vysoké riziko → nutný konformitný postup (technická dokumentácia, logbooky, ľudský dohľad)
CRA (Cyber Resilience Act) — reportovacia povinnosť pre zraniteľnosti od septembra 2026; open-weight modely v produktoch sú súčasťou tejto legislatívy
(Odporúčanie: vždy konzultujte konkrétny use-case so svojím DPO alebo právnym oddelením. „Open-source" neznamená „bez regulačnej záťaže".)
8. Kedy použiť ktorý variant
1B — mobilné aplikácie, edge AI (Raspberry Pi, smartfóny s NPU), rýchla klasifikácia, jednoduchý chatbot offline
4B — firemné laptopy, lokálny asistent pre vývojárov, jednoduchý RAG bez GPU servera
12B — tímový lokálny model, multimodálne úlohy (obrázky + text), customer support bot, RAG nad internými dokumentmi
27B — produkčný server, komplexné generovanie textu, code review, preklad veľkých objemov
Quick Reference
Licencia: Apache 2.0 (plné komerčné použitie)
Vydané: 2026-04-02
Hugging Face:
google/gemma-4-{1b,4b,12b,27b}[-it]Ollama:
gemma4:{1b,4b,12b,27b}[-it]Multimodál: áno (12B a 27B)
Kvantizácia: Q4/Q5/Q8 cez GGUF, bfloat16 pre GPU
Zhrnutie
Gemma 4 je momentálne najdostupnejšia open-weight rodina s komerčne priateľskou licenciou, pokrývajúca celé spektrum od mobilných zariadení po serverové GPU.
Apache 2.0 licencia je kľúčová výhoda pre slovenské a európske firmy, ktoré potrebujú právnu istotu pri embedovaní AI do produktov.
Pre lokálne nasadenie odporúčame 12B-it v Q8 ako dobrý kompromis medzi výkonom a dostupnosťou hardvéru, alebo 27B-it pre tímy so serverovým GPU.
V kontexte EU AI Act platí: open-weight model vo vašom produkte = vaša zodpovednosť za klasifikáciu rizika a konformitu.