Transfer Learning

Transfer Learning je technika, pri ktorej vezmeš model už natrénovaný na veľkej úlohe (alebo na veľkom množstve dát) a „prenastavíš“ ho na svoju konkrétnu úlohu. V praxi je to dôvod, prečo dnes vieš dostať dobrý AI výsledok aj s relatívne malým vlastným datasetom.

1. Čo to je (definícia + analógia)

Definícia: Transfer learning znamená, že model neštartuje od nuly – prenesie si už naučené „vedomosti“ (reprezentácie) do novej úlohy alebo domény.
Analógia: Predstav si kuchára, ktorý roky varil v talianskej reštaurácii. Keď začne variť slovenské jedlá, veľa vecí už vie: prácu s ohňom, chuťové vyváženie, hygienu. Učí sa nové recepty, ale základné zručnosti len prispôsobí.
Čo sa prenáša: Nie hotové odpovede, ale vzorové rozpoznávanie – napr. „ako vyzerá hrana na obrázku“, „ako funguje gramatika“, „aké sú typické vzťahy medzi slovami“.

2. Ako to funguje (krok za krokom)

1) Pretraining (predtrénovanie): Model sa najprv učí na obrovskom množstve dát všeobecné vzory.
- Videnie: učí sa vizuálne rysy (tvary, textúry, objekty).
- Text: učí sa štruktúru jazyka, kontext, súvislosti.
2) Prenos reprezentácií: Vnútorné vrstvy modelu obsahujú užitočné „stavebné bloky“.
- Nižšie vrstvy: často zachytávajú všeobecné rysy (jednoduché vzory).
- Vyššie vrstvy: viac špecifické pre pôvodnú úlohu alebo doménu.
3) Adaptácia na tvoju úlohu: Tu máš typicky tri praktické cesty:
- Feature extractor (bez učenia): model použiješ na tvorbu embeddingov/feature a nad tým postavíš jednoduchý klasifikátor.
- Fine-tuning (doladenie): model ďalej trénuješ na tvojich dátach.
- Čiastočné doladenie: časť vrstiev „zmrazíš“ a trénuješ len zvyšok (alebo len malý doplnok).
4) Kontrola „čo sa pokazí“: Pri prenose môže nastať:
- Catastrophic forgetting: model pri doladení zabudne časť všeobecných schopností.
- Negative transfer: prenos uškodí, lebo pôvodná doména je príliš odlišná.

3. Prečo je to dôležité / kde sa to používa

Rýchlejší štart: Namiesto týždňov a obrovských dát často stačí menší dataset a kratšie doladenie.
Lacnejšie učenie: Šetríš výpočtový výkon – najťažšia práca (predtrénovanie) už prebehla.
Lepšie výsledky v praxi: Získaš model, ktorý je:
- presnejší na tvoju úlohu,
- robustnejší pri šume a neúplných dátach,
- použiteľný aj keď nemáš „big data“.
Typické použitia:
- NLP / chat a klasifikácia textu: firemné maily, tiketový systém, kategorizácia dokumentov, sumarizácie.
- Computer vision: detekcia defektov vo výrobe, rozpoznávanie typov tovaru, kontrola kvality.
- Audio: rozpoznávanie reči, detekcia udalostí v zvuku, analýza hudobných prvkov.
- Recommender systémy: prenos signálov medzi produktovými kategóriami alebo regiónmi.

4. Výhody a obmedzenia

Výhody
- Menej dát: často stačia stovky až tisíce príkladov (nie milióny), ak je úloha „blízko“.
- Rýchlejšie nasadenie: kratší čas od nápadu po pilot.
- Stabilnejší výkon: predtrénovaný model býva menej náchylný na preučenie než model trénovaný od nuly na malých dátach.
Obmedzenia
- Závislosť od pôvodu modelu: ak bol model trénovaný na niečom veľmi odlišnom, prenos môže byť slabý alebo škodlivý.
- Licencie a kompatibilita: nie každý model môžeš legálne/komerčne doladiť alebo nasadiť tak, ako potrebuješ.
- Bias a „zdedené“ chyby: prenášaš aj skreslenia a slepé miesta pôvodného modelu.
- Riziko preučenia: pri malom datasete vie fine-tuning urobiť model „sebavedomo zlý“.

5. Praktické použitie (čo to znamená pre teba)

Kedy sa s tým stretneš, aj keď o tom nevieš
- Keď používaš nástroj, ktorý ponúka custom model alebo doladenie na firemné dáta.
- Keď „AI v appke“ zrazu začne lepšie rozumieť tvojej terminológii – typicky je za tým nejaká forma adaptácie.
Ako si vybrať prístup
- Ak máš málo dát a chceš rýchlo výsledok: začni ako feature extractor (embeddingy + jednoduchý model).
- Ak máš stredne veľa dát a potrebuješ špecifický štýl alebo presnosť: choď do fine-tuning alebo čiastočného doladenia.
- Ak je doména citlivá (zdravie, financie, právne): počítaj s tým, že doladenie nie je len technika – potrebuješ aj validáciu, testy a proces.
Na čo si dať pozor (konkrétne)
- Kvalita dát: radšej 500 čistých príkladov než 5 000 špinavých.
- Rozdelenie dát: drž si bokom test set, ktorý model „nevidel“ – inak si budeš klamať o kvalite.
- Definícia úspechu: stanov si metriku (presnosť, chybovosť, recall pri kritickej triede) ešte pred trénovaním.
- Zabúdanie schopností: ak doladením zhoršíš všeobecné správanie, pomáha:
  - trénovať jemnejšie (nižší learning rate),
  - zmraziť viac vrstiev,
  - použiť menšie adaptačné „doplnky“ namiesto plného pretrénovania.
Bezpečnosť a súkromie v praxi
- Citlivé dáta: ak posielaš dáta do cloudu na doladenie, ber to ako export – anonymizuj, minimalizuj, kontroluj prístupy.
- Úniky cez správanie: model môže „nasávať“ špecifické frázy alebo údaje, ak ich dáš do tréningu príliš doslovne (napr. interné identifikátory, osobné údaje).
- Najmenšie potrebné dáta: trénuj iba to, čo musíš – často stačí upratať slovník, kategórie a príklady.

6. Fine-tuning v kóde (zjednodušene)

Typický fine-tuning zmrazí väčšinu predtrénovaného modelu a doučí len malú časť:

model = load_pretrained("base-model")

# zmraz spodné vrstvy — všeobecné reprezentácie nechaj tak
for p in model.backbone.parameters():
    p.requires_grad = False

# doučíš len novú „hlavu" na svoju úlohu (nízky learning rate!)
optimizer = AdamW(model.head.parameters(), lr=1e-4)
model.fit(my_small_dataset)

Nízky learning rate a zmrazené vrstvy sú obrana proti catastrophic forgetting.

7. Súvislosti

Deep Learning: transfer learning je jeho kľúčová prax pri málom množstve dát.
LLM: dnešné jazykové modely sú v podstate „transfer learning v veľkom" — predtréning + doladenie.
Machine Learning: širší kontext, kam adaptácia modelov patrí.

Zhrnutie

Transfer learning ti umožní stavať AI riešenia bez toho, aby si model trénoval od nuly – prenáša si už naučené vzory.
V praxi to najčastejšie znamená feature extractor, fine-tuning, alebo čiastočné doladenie (zmrazené vrstvy + úprava zvyšku).
Najväčšie riziká sú negative transfer, catastrophic forgetting a slabá kvalita tréningových dát – tieto veci vedia výkon reálne zhoršiť.
Ak chceš dobrý výsledok, najviac pomáha byť konkrétny: jasná metrika, čisté dáta, realistické testovanie a opatrné doladenie.