Proces strojového učení s učitelem

Učení s učitelem (supervised learning) zahrnuje trénovací sadu, která obsahuje označená data, a cílem je najít mapovací funkci, která převádí vstupy na požadované výstupy.

Například model dostane datovou sadu – řekněme ovoce. Shromáždí všechny informace, jako je tvar, velikost, chuť a název ovoce, a učí se z každého typu dat. Jakmile je model vytrénován, je mu předložen nový druh ovoce (testovací data) a na základě trénovacích dat model předpoví název ovoce podle analýzy všech dříve naučených informací.

Učení bez učitele (unsupervised learning) na rozdíl od toho vykazuje samoorganizaci. Algoritmus pracuje s neoznačenými a neklasifikovanými daty a jeho úkolem je v nich najít skryté vlastnosti nebo struktury. Zahrnuje například seskupování dat do skupin (klastrů) na základě podobností, vzorců nebo rozdílů bez jakéhokoli předchozího vedení.

Například model dostane neoznačená data obrázků koček a psů. Model data rozdělí do dvou různých klastrů, aniž by znal jejich označení. Když je mu následně předložen nový obrázek kočky (testovací data), na základě získaných znalostí jej zařadí do klastru koček.

Učení s učitelem je třída metod strojového učení, která stojí v opozici proti učení bez učitele. Trénovací data se přitom sestávají ze vstupních objektů (vektorů jejich příznaků) a jejich požadovaných výstupních ohodnocení, tj. závisle proměnných (obecně také ve tvaru vektorů), tj. výroků učitele o objektu.

Výstupem naučené funkce (jejíž příklady jsou obsaženy v trénovacích datech) pak mohou být spojité hodnoty (při regresi) anebo binární hodnoty označující příslušnost vstupních objektů do daných tříd (při klasifikaci). Naučená funkce pak dokáže odhadovat výstupní ohodnocení každého vstupního objektu (i neobsaženého v trénovacích datech) poté, co zpracuje trénovací příklady (tj. dvojice vstup a požadovaný výstup). Aby to dokázala, musí umět zobecnit (generalizovat) souvislost mezi vstupy a výstupy danou příklady obsaženými v trénovacích datech „smysluplným“ způsobem.[1] (Porovnejte s učením bez učitele.)

Přeučení

Overfitting neboli přeučení je stav, kdy je systém příliš přizpůsoben množině trénovacích dat, ale nemá schopnost generalizace a selhává na validační množině dat. To se může stát např. při malém rozsahu trénovací množiny nebo pokud je systém příliš komplexní, např. příliš mnoho skrytých neuronů v neuronové síti. Řešením je zvětšení trénovací množiny, snížení složitosti systému nebo různé techniky regularizace, jako je zavedení náhodného šumu (což v zásadě odpovídá rozšíření trénovací množiny), zavedení omezení na parametry systému, které v důsledku snižuje složitost popisu naučené funkce, nebo předčasné ukončení učení (průběžné sledování chyby na validační množině a konec učení ve chvíli, kdy se chyba na této množině dostane do svého minima).

Trénovací data

Trénovací data jsou data (v konkrétní počítačové podobě například databáze nebo adresář se soubory), na kterých se v umělé inteligenci nebo strojovém učení odhadují parametry a/nebo struktura modelu. Trénovací data se skládají ze vstupního vektoru (množiny) dat a v případě učení s učitelem také odpovídajícího výstupního vektoru dat.

Pro správné naučení inteligentního systému je obvykle potřeba dostatečně reprezentativní množství trénovacích dat. Inteligentní systémy jsou v podstatě funkce, které ze vstupního vektoru vypočítají výstupní vektor a podle rozdílu od správného výstupního vektoru upraví své vnitřní parametry. Tento proces se opakuje, dokud není systém dostatečně naučen. Trénovací data se dle způsobu užití dělí do tří skupin:

Trénovací množina je sada dat, ve které algoritmus nachází určitý vztah, tj. provádí jejich (regresní analýzu), čímž se ‚učí‘.
Validační množina je sada dat, která se používají pro případnou úpravu parametrů učení ve snaze vyhnout se jeho ‚přeučení‘.
Testovací množina je sada dat, která se používají pro ověření kvality naučeného systému. Měla by být odlišná od trénovací resp. validační množiny. Systém je správně naučený tehdy, jestliže se shodnou úspěšností vyhodnocuje trénovací množinu i testovací množinu. Pokud má vyhodnocení trénovací množiny výrazně vyšší úspěšnost, je systém přeučený.
Reference

Machine learning process with a teacher

Schéma popisuje proces strojového učení s učitelem, konkrétně způsob, jakým model vyhodnocuje a třídí neoznačené otázky podle jejich nejistoty a následně je anotuje a používá pro inferenci.

Překlad do češtiny:

  1. Odhad nejistoty

    • Neoznačené otázky:

      • Qa: Karen si balí batoh na dlouhou túru.
      • Qb: Rob si vezme 2 lahve modrého paliva a poloviční množství bílého paliva. Kolik lahví celkem vezme?
      • Qc: Josh se rozhodne pro obrat domu. Koupí…
    • Vyplňte otázku:

      • Qa: Jsou tam 15 stromů v háji. Pracovníci háje…
      • Qb: Olivia má 32 dolarů. Koupila 5 tašek po 3 dolarech za každou. Olivia má nyní 2 dolary. Odpověď je 38.
  2. Výběr

    • Seznam nejistot:

      • Qa1: 1.0
      • Qa2: 1.0
      • Qa3: 0.8
      • (a tak dále)
    • Nejvíce nejisté otázky:

      • (Seznam otázek jako Qa1, Qa2, atd.)
  3. Anotace

    • Nové Příklady E:
      • Qa1p: Ralph se chystá trénovat tenis s tenisovým míčkovým automatem, který střílí…
      • Testovací Otázka:
      • Qa1c: Hans rezervoval pokoj v hotelu. Hotel má 10 pater. Na každém patře je 10 pokojů. Poslední patro není dostupné. Kolik pokojů hotel má?
  4. Inference

    • (Nezobrazeno na schématu)

https://blog.kore.ai/cobus-greyling/active-prompting-with-chain-of-thought-for-large-language-models

Vladimír Matula

Vladimír Matula se v digitálním marketingu pohybuje od roku 2008. Svou expertízu staví na pevných základech z předních českých agentur, kde se specializoval na tvorbu webů, ecommerce, SEO a webovou analytiku. V roce 2012 založil marketingovou agenturu DIVERSITY PROMOTION s.r.o., kde nabízí online marketingové služby, tvorbu webů na WordPress, tvorbu eshopů na platformě Shoptet, Web design a AI marketing. Generativní AI integruje do klíčových procesů – od hloubkové analýzy dat, SEO a konverzního copywritingu podle ověřených vzorců až po automatizaci rutinních úkolů, které přináší úsporu času a vyšší kvalitu výstupů nejen jemu, ale i jeho klientům.