One-shot prompting (Jednorázová výzva)

Zero-Shot Prompting (Promptování bez příkladu)

Přímé výzvy (také známé jako Zero-shot) jsou nejjednodušším typem výzvy. Neposkytuje žádné příklady k modelu, pouze instrukce.

Příklady Zero-Shot promptů podle funkcí, které ChatGPT nabízí:

1. Překlad:

  • Přeložte tuto větu z němčiny do češtiny: „Das Wetter ist heute schön.“

2. Textová odpověď:

  • Jaké je hlavní město Brazílie?

3. Shrnutí:

  • Shrňte následující odstavec do jedné věty: „Charles Darwin byl britský přírodovědec, jehož teorie evoluce a přírodní výběr měly obrovský vliv na biologii. Jeho kniha ‚O původu druhů‘ je považována za jeden z nejdůležitějších vědeckých textů všech dob.“

4. Generování seznamu:

  • Vyjmenujte pět hlavních ingrediencí pro přípravu českého bramborového salátu.

5. Kreativní psaní:

  • Napište krátkou básničku o podzimu.

6. Doporučení:

  • Doporučte knihu pro někoho, kdo má rád detektivní romány.

7. Oprava gramatiky:

  • Opravte gramatické chyby v této větě: „On šel do obchodě a koupil jablka.“

8. Generování kódu:

  • Napište jednoduchou funkci v Pythonu, která vypočítá součet dvou čísel.

9. Vysvětlení pojmu:

  • Vysvětlete, co je to kvantová fyzika.

10. Nápady na projekty:

  • Navrhněte tři nápady na vědecké projekty pro studenty střední školy.

11. Analýza dat:

  • Vysvětlete, jak interpretovat výsledky analýzy rozptylu (ANOVA).

12. Plánování cesty:

  • Navrhněte třídenní itinerář pro návštěvu Prahy.

13. Poradenství:

  • Jak mohu zlepšit svou produktivitu při práci z domova?

14. Technická podpora:

  • Jak mohu vyřešit problém, kdy se můj počítač náhle vypíná?

15. Vyhledávání informací:

  • Kdo vyhrál Nobelovu cenu za literaturu v roce 2020?

16. Logické hádanky:

  • Vyřešte tuto logickou hádanku: „Máte tři krabice, jedna obsahuje jen jablka, druhá jen pomeranče a třetí obsahuje obojí. Krabice jsou špatně označené. Jak můžete pomocí jednoho pokusu určit obsah krabic?“

One-Shots Prompting (Promptování s příkladem)

One-shot výzva ukazuje modelu jeden jasný a popisný příklad toho, co byste chtěli, aby napodoboval.

Příklad:

Napiš báseň o létu.

Báseň 1.:
Slunce září jasně,

teplý vánek vane,
moře volá hlasně,
léto je tu zase.

Báseň 2.:
Pláže volají tě,

Sluneční deštníky stíní.
Horký písek pálí tě,
když na něm tvé tělo leží-.

Úkol: Napiš báseň o podzimu.

Few-Shot prompt (Promptování s několika příklady)

Few-shots výzva ukazuje modelu několik popisných příklad toho, co byste chtěli, aby napodoboval.

Příklad:

Napiš báseň o létu.

báseň 1 :
Slunce září jasně,

teplý vánek vane,
moře volá hlasně,
léto je tu zase.

báseň 1 :
Slunce září jasně,

teplý vánek vane,
moře volá hlasně,
léto je tu zase.

Úkol: Napiš haiku o podzimu.

Prompt Reframing (Přeformulování)

Technika Prompt Reframing (Přeformulování výzvy) je účinným nástrojem v práci s jazykovými modely, jako je Chat GPT. Jejím hlavním cílem je jemně změnit formulaci výzvy, aniž by se změnil její původní záměr. To může vést k vytváření různých odpovědí, které mohou nabídnout nové pohledy na stejnou problematiku. Tato technika je užitečná zejména při hledání různých perspektiv, zlepšování kvality odpovědí a obohacování obsahu.

Technika Prompt Reframing (Přeformulování) je užitečná metoda v oblasti umělé inteligence, která umožňuje jemně změnit formulaci dotazu, přičemž zůstává věrná původnímu záměru. Tato technika může být velmi užitečná pro získávání různorodých odpovědí na stejný nebo podobný dotaz, čímž se obohacuje kontext a poskytují se nové úhly pohledu.

Podrobnější vysvětlení techniky Prompt Reframing

1. Přizpůsobení výzvy při zachování záměru: Prompt Reframing zahrnuje jemné úpravy v zadání dotazu, které umožňují modelu vygenerovat různé odpovědi, přičemž základní záměr dotazu zůstává stejný. To může zahrnovat změnu struktury věty, použití synonym nebo parafrázování.

2. Podpora různorodých odpovědí: Tím, že se dotaz přeformuluje, může model interpretovat úkol různými způsoby a poskytnout různé odpovědi, které odpovídají původnímu záměru. Tato metoda je užitečná zejména při exploraci různých myšlenek a přístupů.

Techniky formulování pro zachování záměru

A. Použití synonym: Použití různých slov nebo frází, které mají stejný nebo podobný význam, může pomoci modelu generovat různé odpovědi. Například místo „Popište výhody práce z domova“ můžete použít „Jaké jsou přínosy práce z domova?“.

Příklad:

  • Originál: „Popište výhody práce z domova.“
  • Přeformulováno: „Jaké jsou přínosy práce z domova?“

B. Parafrázování otázek: Přeformulování otázky tak, aby byla mírně odlišná, ale stále se zaměřovala na stejný hlavní bod, může vést k různým odpovědím. Tento přístup může přinést nové nuance v odpovědích.

Příklad:

  • Originál: „Jaké jsou výzvy spojené s implementací obnovitelných zdrojů energie?“
  • Přeformulováno: „S jakými obtížemi se můžeme setkat při zavádění obnovitelných zdrojů energie?“

C. Změna perspektivy: Změna úhlu pohledu může nabídnout nový kontext pro odpověď. Například místo otázky z obecného pohledu lze otázku položit z pohledu specifické skupiny lidí.

Příklad:

  • Originál: „Jaké jsou dopady klimatických změn?“
  • Přeformulováno: „Jak klimatické změny ovlivňují zemědělce?“

D. Zahrnutí specifických aspektů: Přidání specifických aspektů do dotazu může vést k více zaměřeným a podrobným odpovědím.

Příklad:

  • Originál: „Diskutujte o technologických inovacích posledního desetiletí.“
  • Přeformulováno: „Jaké technologické inovace v oblasti komunikace byly nejvýznamnější za poslední desetiletí?“

Designové pokyny pro přeformulování promptů

Pro zjednodušení promptů byly identifikovány následující principy:

  1. Použití nízkoúrovňových vzorů: Místo termínů, které vyžadují znalosti kontextu, použijte konkrétní vzory očekávaného výstupu.
  2. Seznamování instrukcí: Přeměňte popisné atributy na odrážkové seznamy. Negativní tvrzení převeďte na pozitivní.
  3. Rozdělení úkolu: Rozdělte úkol na více jednodušších úkolů.
  4. Zavedení omezení: Přidejte explicitní textové instrukce k omezením výstupu.
  5. Specializace instrukce: Přizpůsobte instrukce tak, aby přímo odpovídaly zamýšlenému výstupu.

Template Filling (Vyplňování šablon)

Vyplňování šablon umožňuje snadno vytvářet univerzální a zároveň strukturovaný obsah. Použijete šablonu se zástupci, která umožní rychlé přizpůsobení pro různé situace nebo vstupy při zachování konzistentního formátu.

Přizpůsobení šablon pomocí proměnných a zástupných symbolů

Při vyplňování šablon můžete výstup generativních nástrojů AI dále přizpůsobit definováním několika proměnných pro zástupné symboly. Tuto strategii obvykle používají správci obsahu nebo vývojáři webových stránek, aby pro své webové stránky vytvořili více přizpůsobených fragmentů obsahu generovaných umělou inteligencí.

Předpokládejme, že spravujete webové stránky elektronického obchodu. V takovém případě byste mohli použít standardní šablonu pro popisy produktů a umožnit umělé inteligenci vyplnit pole, jako je název produktu, vlastnosti a cena, a vytvořit tak nový popis s každou odpovědí.

Tato technika je nesmírně výhodná, pokud potřebujete, aby obsah generovaný umělou inteligencí splňoval konkrétní pokyny nebo formáty.

Dalším praktickým případem použití je vytváření automatizovaných, ale personalizovaných e-mailů. Dynamické vyplňování šablon zaručuje, že celková struktura e-mailu je konzistentní, zatímco konkrétní obsah se mění na základě informací o uživateli.

Least-To-Most Prompting (Od nejméně po nejvíce)

V článku Least-to-Most Prompting Enables Complex Reasoning in Large Language Models], který navrhli Zhou a kol. z Google Research, je metoda Least-to-most prompting novou metodou, jejímž cílem je zlepšit schopnost řešení problémů ve velkých jazykových modelech.

Metoda vychází z pedagogické psychologie a spočívá v rozkladu složitých problémů na jednodušší, postupné podproblémy, přičemž využívá odpovědi z předchozích podproblémů k usnadnění řešení následujících.

Implementace metody „least-to-most prompting“ nevyžaduje trénování modelu ani jeho dolaďování

Provádí se výhradně prostřednictvím několika podnětů, což se účinně projevilo v úlohách, jako je symbolická manipulace, kompoziční zobecnění (schopnost naučit se význam slov a následně je asociací aplikovat na jiné pojmy) a matematické uvažování.

Následující obrázek z článku ukazuje řešení matematické slovní úlohy metodou least-to-most ve dvou fázích: (1) dotaz na jazykový model pro rozklad úlohy na dílčí úlohy; (2) dotaz na jazykový model pro postupné řešení dílčích úloh. Odpověď na druhý podproblém je postavena na odpovědi na první podproblém. 

Demonstrační příklady pro výzvu každé fáze jsou v této ilustraci vynechány.

(více…)

Self-Ask Prompting (Sebedotazování)

Z obrázku níže je zřejmé, že sebezpytné podněcování je pokračováním přímého podněcování a podněcování pomocí myšlenkového řetězce.

Zajímavé je, že u self-ask promptingu je explicitně zobrazeno uvažování LLM a LLM také rozkládá otázku na menší navazující otázky.

LLM ví, kdy je dosaženo konečné odpovědi, a může přejít od navazujících mezivýpovědí ke konečné odpovědi.

(více…)

Symbolic Reasoning & PAL (Symbolické uvažování & PAL)

Uvažujme následující otázku:

Mám židli, dvě brambory, květák, hlávku salátu, dva stoly, zelí, dvě cibule a tři lednice. Kolik mám zeleniny?

LLM by měl převést vstup na slovník s entitami a hodnotami podle jejich množství, přičemž by měl odfiltrovat entity, které nejsou zeleninou.

Nakonec je odpovědí součet hodnot slovníku pod výstupem PAL z LLM:

 

# note: I'm not counting the chair, tables, or fridges
vegetables_to_count = {
'potato': 2,
'cauliflower': 1,
'lettuce head': 1,
'cabbage': 1,
'onion': 2
}
answer = sum(vegetables_to_count.values())

Automatic Reasoning (Automatické Uvažování a používání nástrojů ART)

Automatic Reasoning and Tool-use (ART) je rámec, který rovněž využívá zmrazené modely ke generování mezikroků uvažování jako program.

Přístup ART silně připomíná princip agentů, tedy dekompozici problému a využití nástrojů pro každý dekomponovaný krok.

Pomocí ART zmrazený LLM rozkládá instance nové úlohy na více kroků, přičemž využívá externí nástroje, kdykoli je to vhodné.

ART je přístup bez nutnosti jemného dolaďování, který umožňuje automatizovat vícekrokové uvažování a automatický výběr a použití nástrojů.

Kombinace podnětů a nástrojů CoT ve vzájemné návaznosti se ukázala jako silný a robustní přístup k řešení mnoha úloh s LLM. Tyto přístupy obvykle vyžadují ruční tvorbu demonstrací specifických pro danou úlohu a pečlivě skriptované prokládání generování modelů s používáním nástrojů. Paranjape a další, (2023) navrhují nový rámec, který využívá zmrazený LLM k automatickému generování mezikroků uvažování jako program.

ART funguje následujícím způsobem:

  • Při zadání nové úlohy vybere z knihovny úloh ukázky vícekrokového uvažování a použití nástrojů.
  • v době testování pozastaví generování, kdykoli jsou zavolány externí nástroje, a integruje jejich výstupy, než pokračuje v generování.

ART vybízí model k tomu, aby na základě demonstrací zobecnil novou úlohu a použil nástroje na vhodných místech, a to nulovým způsobem. Kromě toho je systém ART rozšiřitelný, protože také umožňuje lidem opravovat chyby v krocích uvažování nebo přidávat nové nástroje jednoduchou aktualizací knihoven úloh a nástrojů. Postup je demonstrován níže (zdroj):

Iterative Prompting (Iterativní promptování)

V poslední době se pozornost přesunula od dolaďování LLM k vylepšenému promptnímu inženýrství. Zajištění kontextových výzev, které obsahují několik tréninkových příkladů a historii konverzace.

Zajištění, aby výzva obsahovala kontextové informace prostřednictvím iterativního procesu.

Iterativní výzvy by měly vytvořit kontextuální řetězec myšlenek, který neguje generování irelevantních faktů a halucinací. Interaktivní kontextová a kontextová výzva.

(více…)

Sequential Prompting (Sekvenční promptování)

Sekvenční promtování zvažuje možnost sestavení schopného doporučovatele s LLM. Obvykle se doporučovací systémy vyvíjejí v pipeline architektuře, která se skládá z vícestupňových procedur generování kandidátů (vyhledávání relevantnějších položek) a řazení (řazení relevantních položek na vyšší pozice).

„Sequential Prompting“ se zaměřuje na fázi řazení doporučovacích systémů, protože LLM jsou dražší pro běh na rozsáhlém souboru kandidátů.

Výkonnost řazení je citlivá na načtené kandidátní položky na nejvyšších místech, což je vhodnější pro zkoumání jemných rozdílů v doporučovacích schopnostech LLM.

(více…)