Deep Learning

Deep Learning je prístup v strojovom učení, kde sa model učí z dát cez viacvrstvové neurónové siete. Prakticky to znamená, že namiesto ručného vymýšľania „pravidiel“ necháš systém, aby si sám poskladal užitočné reprezentácie (vzory) – od jednoduchých až po zložité.


1. Čo to je (definícia + analógia)

  • Definícia: Deep Learning používa neurónové siete s viacerými vrstvami, ktoré sa trénujú tak, aby minimalizovali chybu medzi predikciou a správnou odpoveďou.

  • Analógia „fabriky na význam“: Predstav si výrobnú linku. Na začiatku ide surovina (dáta), prvé stanice robia jednoduché operácie (základné vzory), ďalšie skladajú z týchto vzorov zložitejšie tvary a významy – až na konci dostaneš výsledok (klasifikáciu, text, rozhodnutie).

  • Kde je „deep“: Slovo „deep“ neznamená „mystické“, ale hĺbku vrstiev – čím viac vrstiev, tým viac úrovní abstrakcie sa dá naučiť (ak máš dosť dát a dobrý tréning).


2. Ako to funguje (krok za krokom)

  • Vstup → dopredný priechod: Dáta (obrázok, text, zvuk, čísla) prejdú sieťou a tá vyprodukuje výstup (napr. pravdepodobnosti tried, ďalšie slovo, hodnotu).

  • Loss (chybová funkcia): Výstup sa porovná so „správnou“ odpoveďou a vypočíta sa chyba – jedna hodnota, ktorá hovorí, ako veľmi sa model mýlil.

  • Backpropagation: Sieť sa „opýta“: ktoré váhy v ktorých vrstvách prispeli k chybe najviac? Vypočíta sa gradient (smer, ako chybu znížiť).

  • Update váh (optimalizácia): Optimalizér (napr. Adam/SGD) upraví váhy o malý krok, aby nabudúce bola chyba menšia.

  • Opakovanie v dávkach: Tréning beží v batchoch (malé dávky dát) a v epochách (opakované prechody cez celý dataset).

  • Tréning vs. inferencia:

    • Tréning = učíš váhy, je to drahé na výpočty.

    • Inferencia = používaš už naučený model, typicky lacnejšie a rýchlejšie.

  • Prečo to potrebuje výpočtový výkon: Výpočty sú masívne paralelizovateľné, preto sa často používa GPU/TPU.


3. Prečo je to dôležité / kde sa to používa

  • Videnie (computer vision): Rozpoznávanie objektov, segmentácia, detekcia anomálií v obraze, kontrola kvality.

  • Jazyk a hlas: Preklad, sumarizácia, asistenti, rozpoznávanie reči, syntéza hlasu.

  • Odporúčania a personalizácia: Feed na sociálnych sieťach, odporúčanie videí, produktov, hudby – modely sa učia z obrovských interakčných dát.

  • Predikcie v číslach: Dopyt, poruchy, fraud detekcia, scoring – často v kombinácii s klasickými metódami.

  • Generovanie obsahu: Text, obraz, audio, video – tu deep learning stojí za modernými generatívnymi modelmi.

  • Veda a priemysel: Bioinformatika, materiálový výskum, simulácie, automatizácia – najmä tam, kde sú dáta bohaté a vzory komplexné.


4. Výhody a obmedzenia

  • Výhoda: automatická extrakcia znakov

    • Nemusíš ručne navrhovať „features“ (napr. aké hrany či štatistiky sú dôležité) – model si ich často nájde sám.
  • Výhoda: škálovanie s dátami a výkonom

    • Ak rastú dáta a compute, modely často rastú vo výkone (nie vždy lineárne, ale trend je jasný).
  • Výhoda: transfer learning

    • Už natrénovaný model vieš prispôsobiť (fine-tuning) na konkrétnu úlohu aj s menším množstvom dát.
  • Obmedzenie: potreba dát

    • Pri malých datasetoch deep learning ľahko preučenie (overfitting) – zapamätá si tréning, no zlyhá v realite.
  • Obmedzenie: náklady a infraštruktúra

    • Tréning veľkých modelov je drahý; aj pri menších potrebuješ dobrý pipeline, monitoring a často GPU.
  • Obmedzenie: interpretovateľnosť

    • Model vie byť presný, ale nie vždy vieš jednoducho vysvetliť „prečo“ – to je problém v regulovaných a rizikových doménach.
  • Obmedzenie: citlivosť na dáta

    • Zmena distribúcie (iné svetlo na fotkách, iný typ používateľov, nový slang v texte) vie výkon výrazne zraziť.
  • Bezpečnostný/praktický limit:

    • Ak trénuješ na citlivých dátach, riešiš únik informácií, prístupy, anonymizáciu, a či dáta posielaš do cloudu.

5. Praktické použitie (čo to znamená pre teba)

  • Keď používaš hotové AI modely:

    • V skutočnosti „konzumuješ“ výsledok deep learningu – jeho silné stránky (generalizácia) aj slabé (halucinácie, bias) sú dôsledok tréningu na dátach.
  • Keď chceš riešiť vlastnú úlohu:

    • Najprv si ujasni cieľ a metriky (čo znamená „dobré“), až potom vyber model/architektúru.
  • Keď máš málo dát:

    • Skôr než trénovať od nuly, použi predtrénovaný model a dolaď ho, prípadne použi augmentáciu dát.
  • Keď riešiš kvalitu výstupov:

    • Často viac pomôže čistenie a konzistentné označovanie dát než „magická“ zmena architektúry.
  • Keď riešiš prevádzku:

    • Dôležité je sledovať drift (menia sa vstupy), latenciu, náklady, a mať plán na re-tréning.
  • Keď riešiš súkromie:

    • Rozlišuj, či dáta len posielaš do API (inferencie), alebo ich používaš na tréning; v oboch prípadoch minimalizuj citlivé údaje a prístupy.

Zhrnutie

  • Deep Learning je viacvrstvové učenie z dát: model si skladá z jednoduchých vzorov zložitejšie, až k výsledku.

  • Funguje cez cyklus dopredný priechod → výpočet chyby → spätné šírenie → úprava váh, opakovaný na veľa dátach.

  • Najviac žiari tam, kde sú dáta bohaté a problém komplexný (obraz, jazyk, zvuk), no platíš za to dátami, výkonom a horšou vysvetliteľnosťou.

  • V praxi často vyhráva prístup: predtrénovaný model + dobré dáta + rozumné nasadenie, nie tréning „od nuly“.