Deep Learning

Deep Learning je prístup v strojovom učení, kde sa model učí z dát cez viacvrstvové neurónové siete. Prakticky to znamená, že namiesto ručného vymýšľania „pravidiel“ necháš systém, aby si sám poskladal užitočné reprezentácie (vzory) – od jednoduchých až po zložité.

1. Čo to je (definícia + analógia)

Definícia: Deep Learning používa neurónové siete s viacerými vrstvami, ktoré sa trénujú tak, aby minimalizovali chybu medzi predikciou a správnou odpoveďou.
Analógia „fabriky na význam“: Predstav si výrobnú linku. Na začiatku ide surovina (dáta), prvé stanice robia jednoduché operácie (základné vzory), ďalšie skladajú z týchto vzorov zložitejšie tvary a významy – až na konci dostaneš výsledok (klasifikáciu, text, rozhodnutie).
Kde je „deep“: Slovo „deep“ neznamená „mystické“, ale hĺbku vrstiev – čím viac vrstiev, tým viac úrovní abstrakcie sa dá naučiť (ak máš dosť dát a dobrý tréning).

2. Ako to funguje (krok za krokom)

Vstup → dopredný priechod: Dáta (obrázok, text, zvuk, čísla) prejdú sieťou a tá vyprodukuje výstup (napr. pravdepodobnosti tried, ďalšie slovo, hodnotu).
Loss (chybová funkcia): Výstup sa porovná so „správnou“ odpoveďou a vypočíta sa chyba – jedna hodnota, ktorá hovorí, ako veľmi sa model mýlil.
Backpropagation: Sieť sa „opýta“: ktoré váhy v ktorých vrstvách prispeli k chybe najviac? Vypočíta sa gradient (smer, ako chybu znížiť).
Update váh (optimalizácia): Optimalizér (napr. Adam/SGD) upraví váhy o malý krok, aby nabudúce bola chyba menšia.
Opakovanie v dávkach: Tréning beží v batchoch (malé dávky dát) a v epochách (opakované prechody cez celý dataset).
Tréning vs. inferencia:
- Tréning = učíš váhy, je to drahé na výpočty.
- Inferencia = používaš už naučený model, typicky lacnejšie a rýchlejšie.
Prečo to potrebuje výpočtový výkon: Výpočty sú masívne paralelizovateľné, preto sa často používa GPU/TPU.

3. Prečo je to dôležité / kde sa to používa

Videnie (computer vision): Rozpoznávanie objektov, segmentácia, detekcia anomálií v obraze, kontrola kvality.
Jazyk a hlas: Preklad, sumarizácia, asistenti, rozpoznávanie reči, syntéza hlasu.
Odporúčania a personalizácia: Feed na sociálnych sieťach, odporúčanie videí, produktov, hudby – modely sa učia z obrovských interakčných dát.
Predikcie v číslach: Dopyt, poruchy, fraud detekcia, scoring – často v kombinácii s klasickými metódami.
Generovanie obsahu: Text, obraz, audio, video – tu deep learning stojí za modernými generatívnymi modelmi.
Veda a priemysel: Bioinformatika, materiálový výskum, simulácie, automatizácia – najmä tam, kde sú dáta bohaté a vzory komplexné.

4. Výhody a obmedzenia

Výhoda: automatická extrakcia znakov
- Nemusíš ručne navrhovať „features“ (napr. aké hrany či štatistiky sú dôležité) – model si ich často nájde sám.
Výhoda: škálovanie s dátami a výkonom
- Ak rastú dáta a compute, modely často rastú vo výkone (nie vždy lineárne, ale trend je jasný).
Výhoda: transfer learning
- Už natrénovaný model vieš prispôsobiť (fine-tuning) na konkrétnu úlohu aj s menším množstvom dát.
Obmedzenie: potreba dát
- Pri malých datasetoch deep learning ľahko preučenie (overfitting) – zapamätá si tréning, no zlyhá v realite.
Obmedzenie: náklady a infraštruktúra
- Tréning veľkých modelov je drahý; aj pri menších potrebuješ dobrý pipeline, monitoring a často GPU.
Obmedzenie: interpretovateľnosť
- Model vie byť presný, ale nie vždy vieš jednoducho vysvetliť „prečo“ – to je problém v regulovaných a rizikových doménach.
Obmedzenie: citlivosť na dáta
- Zmena distribúcie (iné svetlo na fotkách, iný typ používateľov, nový slang v texte) vie výkon výrazne zraziť.
Bezpečnostný/praktický limit:
- Ak trénuješ na citlivých dátach, riešiš únik informácií, prístupy, anonymizáciu, a či dáta posielaš do cloudu.

5. Praktické použitie (čo to znamená pre teba)

Keď používaš hotové AI modely:
- V skutočnosti „konzumuješ“ výsledok deep learningu – jeho silné stránky (generalizácia) aj slabé (halucinácie, bias) sú dôsledok tréningu na dátach.
Keď chceš riešiť vlastnú úlohu:
- Najprv si ujasni cieľ a metriky (čo znamená „dobré“), až potom vyber model/architektúru.
Keď máš málo dát:
- Skôr než trénovať od nuly, použi predtrénovaný model a dolaď ho, prípadne použi augmentáciu dát.
Keď riešiš kvalitu výstupov:
- Často viac pomôže čistenie a konzistentné označovanie dát než „magická“ zmena architektúry.
Keď riešiš prevádzku:
- Dôležité je sledovať drift (menia sa vstupy), latenciu, náklady, a mať plán na re-tréning.
Keď riešiš súkromie:
- Rozlišuj, či dáta len posielaš do API (inferencie), alebo ich používaš na tréning; v oboch prípadoch minimalizuj citlivé údaje a prístupy.

6. Ako vyzerá tréningová slučka

Aj keď knižnice veľa skrývajú, jadro tréningu je vždy ten istý cyklus:

for epoch in range(epochs):
    for x, y in dataloader:          # dávky dát
        pred = model(x)              # dopredný priechod
        loss = loss_fn(pred, y)      # ako veľmi sa mýlim
        loss.backward()              # backpropagation: gradienty
        optimizer.step()             # úprava váh
        optimizer.zero_grad()        # reset pre ďalšiu dávku

Presne tento cyklus poháňa LLM, diffusion modely aj GAN-y — líši sa len architektúra a loss funkcia.

7. Súvislosti a pojmy

Machine Learning: deep learning je jeho podmnožina (učenie cez hlboké siete).
Attention / transformery: architektúra za moderným NLP.
Transfer learning: ako využiť predtrénovaný model na vlastnú úlohu s málom dát.
Overfitting: hlavné riziko pri malých datasetoch.

Zhrnutie

Deep Learning je viacvrstvové učenie z dát: model si skladá z jednoduchých vzorov zložitejšie, až k výsledku.
Funguje cez cyklus dopredný priechod → výpočet chyby → spätné šírenie → úprava váh, opakovaný na veľa dátach.
Najviac žiari tam, kde sú dáta bohaté a problém komplexný (obraz, jazyk, zvuk), no platíš za to dátami, výkonom a horšou vysvetliteľnosťou.
V praxi často vyhráva prístup: predtrénovaný model + dobré dáta + rozumné nasadenie, nie tréning „od nuly“.