Recursive Prompting (Rekurzivní výzvy)

Rekurzivní podněty se týkají metody řešení problémů, která spočívá v rozdělení složitého problému na menší, lépe zvládnutelné dílčí problémy, které se pak řeší rekurzivně pomocí řady podnětů.

Tento přístup může být užitečný zejména u úloh, které vyžadují kompoziční zobecnění, kdy se jazykový model musí naučit kombinovat různé informace, aby vyřešil problém.

V kontextu zpracování přirozeného jazyka může rekurzivní podněcování zahrnovat použití přístupu několika podnětů k rozkladu složitého problému na dílčí problémy a následné postupné řešení extrahovaných dílčích problémů s využitím řešení předchozích dílčích problémů k zodpovězení dalšího problému.

Tento přístup lze použít pro úlohy, jako jsou matematické problémy nebo odpovědi na otázky, kde je třeba, aby jazykový model dokázal rozložit složité problémy na menší, lépe zvládnutelné části a dospěl k řešení.

Jazykový model pak může řešit každý dílčí problém samostatně nebo postupně, přičemž řešení předchozího dílčího problému použije k zodpovězení dalšího. 

(více…)

Multimodal Chain-of-Thought Prompting

Velké jazykové modely (LLM) vykazují působivý výkon při komplexním uvažování, protože využívají podněty myšlenkového řetězce (CoT) ke generování mezilehlých řetězců uvažování jako zdůvodnění pro odvození odpovědi. Dosavadní studie CoT se však zaměřovaly na modalitu jazyka.

Multimodal Chain-of-Thought Reasoning řeší omezení současných studií CoT v LLM tím, že zahrnuje jak jazykovou (text), tak zrakovou (obrázky) modalitu.

Multimodal-CoT je nový dvoustupňový rámec, který zlepšuje komplexní uvažování v LLM. Tento přístup nejprve generuje zdůvodnění pomocí textu i obrazů a poté tato vylepšená zdůvodnění využívá pro přesnější odvozování odpovědí. Tato metoda představuje významný odklon od dosavadních studií CoT, které se zaměřují pouze na jazykovou modalitu.

Následující obrázek z článku ukazuje příklad multimodální úlohy CoT.

(více…)

Chain-of-Verification (CoVe): Průvodce metodou postupného ověřování

Generování věrohodných, ale nesprávných faktických informací, tzv. halucinace, je ve velkých jazykových modelech nevyřešeným problémem.

Chain-of-Verification Reduces Hallucination snižuje halucinace ve velkých jazykových modelech

Metoda Chain-of-Verification (CoVe) nejprve

(i) navrhne počáteční odpověď; poté

(ii) naplánuje ověřovací otázky k ověření svého návrhu;

(iii) odpoví na tyto otázky nezávisle, aby odpovědi nebyly zkresleny jinými odpověďmi; a

(iv) vygeneruje svou konečnou ověřenou odpověď.

Následující obrázek ilustruje metodu řetězového ověřování (CoVe).

(více…)

Jaký je rozdíl mezi „Chain of Thought“ a „Tree of Thought“?

Srovnání a účinnost

    • Složitost: Tree of Thought je ze své podstaty složitější, protože zahrnuje zvažování více linií uvažování současně. Je to komplexnější, ale také náročnější na efektivní strukturu.
    • Použitelnost: Řetězec myšlení je obecně přímočařejší a lze jej aplikovat na širokou škálu problémů, zejména tam, kde je výhodný lineární postup krok za krokem. Tree of Thought je vhodnější pro scénáře s možnostmi větvení, kde je třeba vzít v úvahu více faktorů nebo výsledků.
    • Efektivita: Pro jednodušší problémy je Chain of Thought obvykle efektivnější, protože je přímější. U složitějších, mnohostranných problémů může Tree of Thought poskytnout důkladnější průzkum problémového prostoru.
    • Co je lepší?: Výběr mezi nimi závisí na povaze úkolu. Pro většinu přímočarých úkolů při řešení problémů stačí Chain of Thought a snáze se ovládá. Tree of Thought se lépe hodí pro složité, vícerozměrné problémy, kde je třeba vyhodnotit různé hypotézy nebo scénáře.

    Stručně řečeno, obě metody mají za cíl zlepšit schopnosti uvažování jazykových modelů tím, že je vedou strukturovanějším myšlenkovým procesem. Volba toho, který se použije, by měla být založena na konkrétních požadavcích daného problému.

    Podněcování k řetězci myšlenek

      • Princip: Ve výzvě Chain of Thought uživatel zapíše mezikroky nebo proces uvažování, které by mohly vést k odpovědi. Tento přístup pomáhá modelu „myslet nahlas“ nebo následovat logický postup kroků k dosažení závěru.
      • Použití: Je zvláště užitečné pro složité problémy, jako jsou matematické slovní úlohy, kde pouhé uvedení problému neposkytuje dostatečné vodítko pro model. Zahrnutím řetězce uvažování je model povzbuzen k tomu, aby se řídil podobným přístupem krok za krokem.
      • Příklad: U matematického problému by výzva obsahovala jak problém, tak sekvenční podrobné vysvětlení, jak jej vyřešit, a provázet model procesem uvažování.

      Strom myšlenek podněcování

        • Princip: Nabádání Tree of Thought je sofistikovanější přístup, kde se paralelně zvažuje více linií uvažování. Je to jako vytvořit rozhodovací strom, kde každá větev představuje jinou cestu myšlení nebo jiný aspekt problému.
        • Použití: Tato metoda je užitečná pro problémy, kde může existovat více platných přístupů nebo když doména problému zahrnuje řešení možností a výsledků větvení.
        • Příklad: Ve složitém scénáři s více proměnnými nebo možnými výsledky by výzva zahrnovala prozkoumání těchto různých cest, jako je zvažování různých možných příčin jevu ve vědeckém problému.

        Srovnání a účinnost

        • Složitost: Tree of Thought je ze své podstaty složitější, protože zahrnuje zvažování více linií uvažování současně. Je to komplexnější, ale také náročnější na efektivní strukturu.
        • Použitelnost: Řetězec myšlení je obecně přímočařejší a lze jej aplikovat na širokou škálu problémů, zejména tam, kde je výhodný lineární postup krok za krokem. Tree of Thought je vhodnější pro scénáře s možnostmi větvení, kde je třeba vzít v úvahu více faktorů nebo výsledků.
        • Efektivita: Pro jednodušší problémy je Chain of Thought obvykle efektivnější, protože je přímější. U složitějších, mnohostranných problémů může Tree of Thought poskytnout důkladnější průzkum problémového prostoru.
        • Co je lepší?: Výběr mezi nimi závisí na povaze úkolu. Pro většinu přímočarých úkolů při řešení problémů stačí Chain of Thought a snáze se ovládá. Tree of Thought se lépe hodí pro složité, vícerozměrné problémy, kde je třeba vyhodnotit různé hypotézy nebo scénáře.

        Stručně řečeno, obě metody mají za cíl zlepšit schopnosti uvažování jazykových modelů tím, že je vedou strukturovanějším myšlenkovým procesem. Volba toho, který se použije, by měla být založena na konkrétních požadavcích daného problému.

        Výzvy „Chain of Thought“ a „Tree of Thought“ jsou metody používané ke zvýšení výkonu velkých jazykových modelů, jako je GPT-3 nebo GPT-4, zejména u složitých úloh, které vyžadují vícekrokové uvažování nebo řešení problémů.

        (více…)