Inductive Bias
Inductive Bias je sada „predpokladov“, ktoré má učící sa algoritmus zabudované, aby vedel z obmedzených dát odhadnúť niečo aj o prípadoch, ktoré ešte nevidel. Bez tohto biasu by sa model často správal ako študent, ktorý sa naučí odpovede naspamäť, ale pri mierne inej otázke sa rozsype.
1. Čo to je (definícia + analógia)
Predpoklad navyše: Model má vždy viac možných vysvetlení dát — inductive bias je to, čo ho tlačí k niektorým riešeniam a od iných ho odrádza.
Analógia – skladanie puzzle: Keď skladáš puzzle a chýba polovica dielikov, aj tak „uhádneš“ oblohu vs. trávu podľa farby a vzoru. To je bias: preferuješ hladké plochy a známe štruktúry.
Generalizácia: Bias je dôvod, prečo model nefunguje len na tréningových príkladoch, ale aj na nových.
2. Ako to funguje
Výber priestoru riešení: Algoritmus implicitne hovorí: „hľadám riešenia tohto typu“ (napr. hladké funkcie, jednoduchšie vysvetlenia, riedke váhy).
Architektúra ako bias: To, že použiješ CNN, transformer, alebo klasický lineárny model, je obrovský bias — každý z nich „verí“ inému typu štruktúry.
Regularizácia: Veci ako L2, dropout, early stopping alebo data augmentation tlačia model k riešeniam, ktoré sú stabilnejšie a menej „preučené“.
Predtrénovanie: Keď model už videl veľa dát, nesie si bias z toho, čo považuje za „pravdepodobné“ v jazyku či obrazoch.
3. Prečo je to dôležité / kde sa to používa
Malé dáta, veľké očakávania: Keď máš málo príkladov, bias rozhoduje, či sa model naučí užitočný vzor alebo len náhodu.
Výber modelu nie je detail: Pre text, obraz, časové rady a tabuľky fungujú iné biasy — preto sa nehodí „jeden model na všetko“.
Praktické produkty: Všetko od odporúčaní cez rozpoznávanie obrazu až po LLM stojí na biasoch: čo je „podobné“, čo je „relevantné“, čo je „pravdepodobná odpoveď“.
Krátka orientačná mapa biasov:
| Typ biasu | Čo preferuje | Kde to cítiš |
|---|---|---|
| Jednoduchosť | kratšie / hladšie vysvetlenia | menej overfitu, často lepší „common sense“ |
| Lokalita (CNN) | blízke pixely spolu súvisia | detekcia hrán, textúr, objektov |
| Sekvencia (transformer) | závislosti v poradí tokenov | jazyk, kód, dlhé kontexty |
| Riedkosť | „použi málo parametrov“ | selekcia príznakov, stabilita |
4. Výhody a obmedzenia
Výhody
Rýchlejšie učenie: Pri správnom biase potrebuješ menej dát na rozumný výsledok.
Lepšia generalizácia: Model sa menej lepí na šum a viac na štruktúru.
Predvídateľnejšie správanie: Vieš lepšie odhadnúť, kedy model zlyhá (napr. mimo domény).
Obmedzenia
Slepé miesta: Zlý bias vedie k systematickým chybám (napr. ignorovanie dôležitého signálu).
„Správne“ len pre niektoré úlohy: Bias, ktorý pomáha na jednom type dát, môže škodiť inde.
Závislosť od domény: Bez doménovej znalosti môžeš vybrať architektúru/regularizáciu, ktorá dáva pekné metriky, ale zlé reálne výsledky.
5. Praktické použitie (čo to znamená pre bežného používateľa AI)
Prečo sa AI tvári sebavedomo: LLM majú bias na „plynulý text“. Aj keď si nie sú isté, vedia znieť presvedčivo — preto potrebuješ overovanie.
Prečo prompt niekedy nestačí: Prompt mení správanie, ale nemení základný bias modelu. Ak je problém mimo jeho „zvykov“, často nepomôže ani lepšie formulovanie.
Ako si vybrať nástroj: Ak riešiš tabuľky a čísla, hľadaj nástroje/modely s biasom na štruktúrované dáta; pri obraze zas na vizuálnu štruktúru.
6. Zhrnutie
Inductive Bias je dôvod, prečo model vie ísť „za dáta“ a generalizovať, nie len memorovať.
Najsilnejší bias je často architektúra a tréningový režim, nie drobné nastavenia.
Správny bias ti šetrí dáta a čas; zlý bias vytvára systematické chyby.
Ak chceš spoľahlivosť, sleduj správanie mimo tréningovej domény, nie len pekné skóre na benchmarku.