Techniky & tréning
21 tém
Attention Mechanism
Attention Mechanism je technika, vďaka ktorej sa model pri spracovaní textu (alebo obrazu, zvuku) dynamicky zameriava na tie časti vstupu, ktoré sú pre aktuálny krok najdôležitejšie. Predstav si to...
Deep Learning
Deep Learning je prístup v strojovom učení, kde sa model učí z dát cez viacvrstvové neurónové siete. Prakticky to znamená, že namiesto ručného vymýšľania „pravidiel“ necháš systém, aby si sám...
Diffusion Models
Diffusion models sú generatívne AI modely, ktoré vytvárajú nové dáta (najčastejšie obrázky) tak, že sa naučia postupne odšumovať náhodný šum až na zmysluplný výstup. V praxi sú jadrom mnohých...
Few-Shot Prompting
Few Shot Prompting je technika, pri ktorej modelu nedáš iba zadanie úlohy, ale aj niekoľko ukážkových dvojíc vstup výstup . Model sa podľa nich prispôsobí očakávanému formátu, štýlu a rozhodovacím...
Flash-MoE: 397-miliardový model na bežnom notebooku NEW
Jedným z najväčších obmedzení veľkých jazykových modelov (LLM) bola vždy pamäť. Model s 397 miliardami parametrov tradične vyžadoval serverovú farmu s desiatkami GPU. Flash MoE tento predpoklad úplne...
GAN
GAN (Generative Adversarial Network) je generatívna technika, kde sa dva neurónové modely „naťahujú“ v hre: jeden vytvára falošné dáta a druhý sa ich snaží odhaliť. Výsledok je generátor, ktorý vie...
Gradient Descent
Gradient Descent je základná metóda, ako „učiť“ model: opakovane upravuje svoje parametre tak, aby znižoval chybu (loss). Predstav si to ako zostup z kopca v hmle — nevidíš celé údolie, ale vieš,...
Graph Neural Networks
Graph Neural Networks (GNN) sú neurónové siete navrhnuté na prácu s grafmi – teda s dátami, kde sú objekty (uzly) prepojené vzťahmi (hrany). Namiesto toho, aby spracúvali dáta ako mriežku (obrázky)...
Inference
Inference je fáza, keď už je AI model natrénovaný a ty ho reálne používaš: pošleš prompt a model začne generovať odpoveď token po tokene. Je to „prevádzka“ modelu v praxi — a práve tu sa láme...
Knowledge distillation
Knowledge distillation (destilácia znalostí) je technika kompresie modelu, kde silný model ( teacher ) odovzdáva svoje správanie menšiemu modelu ( student ). Cieľ je dosiahnuť čo najlepší kompromis...
LoRA
LoRA (Low Rank Adaptation) je technika, ako doladiť veľký model na konkrétnu úlohu tak, že necháš pôvodné váhy „zamrznuté“ a učíš len malé doplnkové vrstvy — výsledkom je lacnejší a praktickejší fine...
Machine Learning (ML)
Machine Learning (ML) je prístup, pri ktorom počítač nezíska „pevný návod“ pravidiel, ale učí sa z príkladov v dátach. V praxi to znamená, že namiesto ručného programovania každej výnimky necháš...
Mixture of Experts (MoE)
Keď sa pozrieš na najväčšie AI modely posledných rokov — DeepSeek , Gemini , Mixtral či GPT 4 — všetky majú jedno spoločné: využívajú architektúru Mixture of Experts (MoE) . Táto technika umožňuje...
Overfitting
Overfitting (preučenie) je stav, keď sa AI model počas tréningu „naučí naspamäť" tréningové dáta až príliš dobre, vrátane šumu a náhodných detailov, a potom zlyháva pri generalizácii na nové,...
Pokročilý Prompt Engineering
Prompt engineering nie je len o tom „napísať dobrú otázku". Na pokročilej úrovni ide o systematické riadenie myslenia jazykového modelu — od štruktúry úvah, cez sebakontrolu, až po celé meta systémy...
Prompt Engineering
Prompt Engineering je disciplína zameraná na navrhovanie a optimalizáciu vstupov (promptov) pre veľké jazykové modely (LLM) s cieľom dosiahnuť čo najlepší výstup. Nejde len o „správne sa opýtať" — je...
RAG
RAG je technika, ktorá kombinuje vyhľadávanie informácií z externých zdrojov s generovaním textu pomocou LLM. Namiesto spoliehaľa sa na "pamäť" modelu z tréningu, RAG v reálnom čase vyhľadá...
RLHF
RLHF (Reinforcement Learning from Human Feedback) je tréningový prístup, kde sa model učí z ľudských preferencií: ľudia porovnávajú odpovede a model sa nastaví tak, aby častejšie produkoval tie...
Syntetické dáta v AI
Svet umelej inteligencie čelí paradoxu: modely sú čoraz väčšie a schopnejšie, ale kvalitných tréningových dát je čoraz menej . Väčšina verejne dostupného textu na internete už bola použitá. Čo teraz?...
Transfer Learning
Transfer Learning je technika, pri ktorej vezmeš model už natrénovaný na veľkej úlohe (alebo na veľkom množstve dát) a „prenastavíš“ ho na svoju konkrétnu úlohu. V praxi je to dôvod, prečo dnes vieš...
U-Net
U Net je neurónová sieťová architektúra navrhnutá na „presné vystrihovanie“ objektov z obrázka na úrovni pixelov (segmentáciu). Pôvodne sa preslávila v medicínskych snímkach, ale dnes ju v rôznych...