Gemma 3

Gemma 3 je tretia generácia open-source jazykových modelov od Google DeepMind, navrhnutá pre efektívny beh na lokálnom hardvéri – od notebookov až po single-GPU servery. Pokračuje v tradícii sprístupňovania výskumných modelov širokej komunite.

1. Čo je Gemma 3

Gemma 3 je rodina modelov s veľkosťami 1B, 4B, 12B a 27B parametrov, pričom všetky sú navrhnuté na maximálnu efektivitu:

Multimodálny vstup – Gemma 3 (od 4B vyššie) dokáže spracovať nielen text, ale aj obrázky, čo z nej robí prvú multimodálnu Gemmu
Kontext 128K tokenov – Výrazný skok oproti predchádzajúcim generáciám, umožňuje spracovanie dlhých dokumentov, kódových báz a konverzácií
Sliding window attention – Kombinácia lokálnej (1024 tokenov) a globálnej pozornosti pre efektívnu prácu s pamäťou
Kvantizácia – Oficiálna podpora 4-bitovej kvantizácie, čo umožňuje beh 27B modelu na 16 GB VRAM

2. Architektúra a technické inovácie

Gemma 3 prináša niekoľko architektonických zmien oproti Gemma 2:

Sliding Window Attention (SWA)

Namiesto klasickej plnej pozornosti na všetky tokeny využíva Gemma 3 striedanie dvoch typov vrstiev:

Lokálne vrstvy – pozornosť len na najbližších 1024 tokenov (rýchle, pamäťovo úsporné)
Globálne vrstvy – plná pozornosť na celý kontext (každá 5. vrstva)

Tento prístup dramaticky znižuje pamäťové nároky pri zachovaní schopnosti pracovať s dlhým kontextom.

Multimodálny encoder

Pre spracovanie obrázkov používa Gemma 3 encoder založený na SigLIP (Sigmoid Loss for Image-Language Pre-training):

Obrázok sa rozdelí na patches (oblasti) a zakóduje do embeddings
Tieto embeddings sa prepoja s textovými tokenmi cez špeciálne Pan & Scan rozloženie – obrázok sa adaptívne rozreže na menšie časti pre lepšie zachytenie detailov

Tokenizátor

Gemma 3 používa rozšírený tokenizátor s 262K slovníkom (oproti 256K v Gemma 2), čo zlepšuje pokrytie jazykov mimo angličtiny – vrátane slovenčiny a češtiny.

3. Výkon a porovnanie

Gemma 3 27B dosahuje výsledky porovnateľné s výrazne väčšími modelmi:

MMLU (všeobecné znalosti): 75.6% – porovnateľné s Llama 3.1 70B
HumanEval (kódovanie): 78.0% – konkurenčné k väčším modelom
Multijazykové benchmarky: Výrazné zlepšenie v jazykoch ako nemčina, francúzština, japonština
Vision benchmarky: Na úrovni špecializovaných multimodálnych modelov pri zlomku veľkosti

Pre kontext – Gemma 3 27B beží na jedinom GPU (napr. RTX 4090 s 24 GB), zatiaľ čo porovnateľné modely vyžadujú multi-GPU setup.

4. Praktické využitie

Lokálny AI asistent

Gemma 3 je ideálna pre beh lokálnych AI asistentov cez nástroje ako Ollama alebo llama.cpp:

ollama run gemma3:27b

Model beží plne offline, bez odosielania dát na server – vhodné pre prácu s citlivými dokumentmi.

Fine-tuning a prispôsobenie

Vďaka LoRA a QLoRA je možné Gemmu 3 efektívne doladiť na špecifické úlohy:

Zákaznícka podpora v konkrétnom jazyku
Analýza domén-špecifických dokumentov (právne, medicínske)
Generovanie kódu v špecifickom frameworku

Multimodálne aplikácie

Popis a analýza obrázkov
Extrakcia textu z fotografií (OCR-like schopnosti)
Vizuálne otázky a odpovede (VQA)

5. Licencia a ekosystém

Gemma 3 používa Gemma License – permisívnu licenciu, ktorá umožňuje:

Komerčné použitie
Modifikáciu a redistribúciu
Fine-tuning a vytváranie derivátov

Obmedzenia sa týkajú primárne generovania škodlivého obsahu a zneužitia modelu.

Ekosystém:

Google AI Studio – bezplatný playground pre testovanie
Hugging Face – oficiálne váhy a komunitné fine-tuny
Kaggle – notebooky a datasety pre experimentovanie
Vertex AI – produkčný deployment v Google Cloud

6. Gemma 3 vs konkurencia

Aspekt	Gemma 3 27B	Llama 3.1 70B	Qwen 2.5 72B
Parametre	27B	70B	72B
Kontext	128K	128K	128K
Multimodálne	✅ Áno	❌ Nie	✅ Áno
Min. VRAM	16 GB (Q4)	40+ GB	40+ GB
Licencia	Permisívna	Permisívna	Apache 2.0

Hlavná výhoda Gemmy 3 je pomer výkonu k veľkosti – dosahuje výsledky veľkých modelov pri zlomku hardvérových nárokov.

7. Budúcnosť

Google DeepMind naznačil ďalší vývoj v smere:

Gemma 3n – ešte menšie modely optimalizované pre mobilné zariadenia
Lepšia integrácia s Android a on-device AI
Rozšírenie multimodálnych schopností o audio a video

Gemma 3 reprezentuje trend demokratizácie AI – kvalitné modely dostupné na bežnom hardvéri, bez potreby cloudových služieb a drahých GPU clusterov.

Zhrnutie

Gemma 3 je najdostupnejší vysoko-kvalitný open-source model od Google. Kombinácia multimodality, dlhého kontextu a efektívnej architektúry z nej robí silného kandidáta pre lokálne AI aplikácie. Ak máte GPU s 16+ GB VRAM, Gemma 3 27B je jednou z najlepších volieb pre lokálny AI.