Hermes: Otvorené modely od Nous Research

Hermes je rodina open-weights jazykových modelov od Nous Research — jeden z najznámejších príkladov toho, ako ďaleko sa dá dostať kvalitným post-trainingom otvorených základov. Pre každého, kto chce bežať silný model lokálne alebo bez závislosti na uzavretých API, je Hermes referenčný bod.


1. Čo je Hermes a kto za ním stojí

Nous Research začínal ako komunita nadšencov okolo fine-tuningu otvorených modelov a vyrástol na rešpektované AI laboratórium. Séria Hermes je ich vlajková loď: nejde o modely trénované od nuly, ale o dôkladný post-training (SFT + preferenčné techniky ako DPO) nad otvorenými základmi — historicky Llama, neskôr aj ďalšie open-weights rodiny.

Kľúčové črty filozofie Hermes:

  • Open weights — váhy sú voľne stiahnuteľné (Hugging Face), model môžete bežať na vlastnom hardvéri.
  • Steerability — model sa drží system promptu bez toho, aby presadzoval vlastnú „osobnosť" alebo nadbytočné odmietanie.
  • Transparentný tréning — Nous publikuje technické reporty a veľkú časť dátových postupov.

2. Ako Hermes vzniká: dáta namiesto výpočtov

Nous Research nemá tréningové rozpočty frontier laboratórií, preto stavia na kvalite dát. Pipeline DataForge generuje syntetické tréningové príklady cielene podľa domén (kód, matematika, roleplay, štruktúrované výstupy) a filtruje ich cez automatické hodnotenie. Výsledok: relatívne malý, ale hustý dataset, ktorý zo základného modelu vytiahne výrazne lepšie správanie.

Novšie generácie (Hermes 3, Hermes 4) pridali hybridné reasoning režimy — model vie na požiadanie prepnúť do dlhého uvažovania s <think> stopou a potom vrátiť zhustenú odpoveď, podobne ako uzavreté reasoning modely.

3. Hermes vs. uzavreté modely — kedy čo

Kritérium Hermes (open-weights) Uzavreté API (Claude, GPT)
Nasadenie vlastný hardvér, plná kontrola len cez API poskytovateľa
Súkromie dát dáta neopúšťajú vašu infraštruktúru dáta idú tretej strane
Špičkový výkon top medzi open-weights vyšší (frontier trieda)
Cena pri veľkom objeme fixné náklady na GPU platba za token
Údržba vlastná zodpovednosť rieši poskytovateľ
Prispôsobenie plný fine-tuning možný obmedzené (prompt, RAG)

4. Praktické použitie

  • Lokálne nasadenie: menšie varianty (8B–70B) bežia na jednej pracovnej stanici s dostatočnou VRAM; kvantizované verzie (GGUF, AWQ) aj na spotrebiteľských GPU.
  • Function calling a JSON: Hermes má dlhodobo nadštandardnú podporu štruktúrovaných výstupov a volania nástrojov — hodí sa do agentických pipeline, kde potrebujete spoľahlivú schému.
  • Citlivé domény: tam, kde dáta nesmú opustiť firmu (zdravotníctvo, právo, interné dokumenty), je open-weights model s vlastným hostingom často jediná schodná cesta.
  • Výskum: voľné váhy umožňujú interpretability experimenty, ablácie a vlastný ďalší fine-tuning.

5. Limity a na čo si dať pozor

  • Výkonový strop: proti aktuálnym frontier modelom (Claude Fable 5 a spol.) Hermes zaostáva v najťažších reasoning a agentických úlohách — porovnateľný je skôr so staršími uzavretými generáciami.
  • Steerability je dvojsečná: minimálne odmietanie znamená, že bezpečnostné mantinely si musíte postaviť sami (filtre, moderácia, audit logy).
  • Prevádzková réžia: serving, škálovanie, monitoring a aktualizácie modelu idú za vami — TCO býva vyšší, než vyzerá z ceny GPU.
  • Licencie základov: váhy dedia licenciu základného modelu (napr. Llama Community License) — pred komerčným nasadením treba skontrolovať podmienky.

Zhrnutie: Hermes od Nous Research je najviditeľnejšia odpoveď open-weights sveta na uzavreté modely: dátovo precízny post-training, silná steerability a plná kontrola nad nasadením. Frontier výkon nečakajte, ale ako lokálny pracant pre štruktúrované úlohy a citlivé dáta je ťažko prekonateľný.