Gemma 3

Gemma 3 je tretia generácia open-source jazykových modelov od Google DeepMind, navrhnutá pre efektívny beh na lokálnom hardvéri – od notebookov až po single-GPU servery. Pokračuje v tradícii sprístupňovania výskumných modelov širokej komunite.


1. Čo je Gemma 3

Gemma 3 je rodina modelov s veľkosťami 1B, 4B, 12B a 27B parametrov, pričom všetky sú navrhnuté na maximálnu efektivitu:

  • Multimodálny vstup – Gemma 3 (od 4B vyššie) dokáže spracovať nielen text, ale aj obrázky, čo z nej robí prvú multimodálnu Gemmu
  • Kontext 128K tokenov – Výrazný skok oproti predchádzajúcim generáciám, umožňuje spracovanie dlhých dokumentov, kódových báz a konverzácií
  • Sliding window attention – Kombinácia lokálnej (1024 tokenov) a globálnej pozornosti pre efektívnu prácu s pamäťou
  • Kvantizácia – Oficiálna podpora 4-bitovej kvantizácie, čo umožňuje beh 27B modelu na 16 GB VRAM

2. Architektúra a technické inovácie

Gemma 3 prináša niekoľko architektonických zmien oproti Gemma 2:

Sliding Window Attention (SWA)

Namiesto klasickej plnej pozornosti na všetky tokeny využíva Gemma 3 striedanie dvoch typov vrstiev:

  • Lokálne vrstvy – pozornosť len na najbližších 1024 tokenov (rýchle, pamäťovo úsporné)
  • Globálne vrstvy – plná pozornosť na celý kontext (každá 5. vrstva)

Tento prístup dramaticky znižuje pamäťové nároky pri zachovaní schopnosti pracovať s dlhým kontextom.

Multimodálny encoder

Pre spracovanie obrázkov používa Gemma 3 encoder založený na SigLIP (Sigmoid Loss for Image-Language Pre-training):

  • Obrázok sa rozdelí na patches (oblasti) a zakóduje do embeddings
  • Tieto embeddings sa prepoja s textovými tokenmi cez špeciálne Pan & Scan rozloženie – obrázok sa adaptívne rozreže na menšie časti pre lepšie zachytenie detailov

Tokenizátor

Gemma 3 používa rozšírený tokenizátor s 262K slovníkom (oproti 256K v Gemma 2), čo zlepšuje pokrytie jazykov mimo angličtiny – vrátane slovenčiny a češtiny.


3. Výkon a porovnanie

Gemma 3 27B dosahuje výsledky porovnateľné s výrazne väčšími modelmi:

  • MMLU (všeobecné znalosti): 75.6% – porovnateľné s Llama 3.1 70B
  • HumanEval (kódovanie): 78.0% – konkurenčné k väčším modelom
  • Multijazykové benchmarky: Výrazné zlepšenie v jazykoch ako nemčina, francúzština, japonština
  • Vision benchmarky: Na úrovni špecializovaných multimodálnych modelov pri zlomku veľkosti

Pre kontext – Gemma 3 27B beží na jedinom GPU (napr. RTX 4090 s 24 GB), zatiaľ čo porovnateľné modely vyžadujú multi-GPU setup.


4. Praktické využitie

Lokálny AI asistent

Gemma 3 je ideálna pre beh lokálnych AI asistentov cez nástroje ako Ollama alebo llama.cpp:

ollama run gemma3:27b

Model beží plne offline, bez odosielania dát na server – vhodné pre prácu s citlivými dokumentmi.

Fine-tuning a prispôsobenie

Vďaka LoRA a QLoRA je možné Gemmu 3 efektívne doladiť na špecifické úlohy:

  • Zákaznícka podpora v konkrétnom jazyku
  • Analýza domén-špecifických dokumentov (právne, medicínske)
  • Generovanie kódu v špecifickom frameworku

Multimodálne aplikácie

  • Popis a analýza obrázkov
  • Extrakcia textu z fotografií (OCR-like schopnosti)
  • Vizuálne otázky a odpovede (VQA)

5. Licencia a ekosystém

Gemma 3 používa Gemma License – permisívnu licenciu, ktorá umožňuje:

  • Komerčné použitie
  • Modifikáciu a redistribúciu
  • Fine-tuning a vytváranie derivátov

Obmedzenia sa týkajú primárne generovania škodlivého obsahu a zneužitia modelu.

Ekosystém:

  • Google AI Studio – bezplatný playground pre testovanie
  • Hugging Face – oficiálne váhy a komunitné fine-tuny
  • Kaggle – notebooky a datasety pre experimentovanie
  • Vertex AI – produkčný deployment v Google Cloud

6. Gemma 3 vs konkurencia

Aspekt Gemma 3 27B Llama 3.1 70B Qwen 2.5 72B
Parametre 27B 70B 72B
Kontext 128K 128K 128K
Multimodálne ✅ Áno ❌ Nie ✅ Áno
Min. VRAM 16 GB (Q4) 40+ GB 40+ GB
Licencia Permisívna Permisívna Apache 2.0

Hlavná výhoda Gemmy 3 je pomer výkonu k veľkosti – dosahuje výsledky veľkých modelov pri zlomku hardvérových nárokov.


7. Budúcnosť

Google DeepMind naznačil ďalší vývoj v smere:

  • Gemma 3n – ešte menšie modely optimalizované pre mobilné zariadenia
  • Lepšia integrácia s Android a on-device AI
  • Rozšírenie multimodálnych schopností o audio a video

Gemma 3 reprezentuje trend demokratizácie AI – kvalitné modely dostupné na bežnom hardvéri, bez potreby cloudových služieb a drahých GPU clusterov.


Zhrnutie

Gemma 3 je najdostupnejší vysoko-kvalitný open-source model od Google. Kombinácia multimodality, dlhého kontextu a efektívnej architektúry z nej robí silného kandidáta pre lokálne AI aplikácie. Ak máte GPU s 16+ GB VRAM, Gemma 3 27B je jednou z najlepších volieb pre lokálny AI.