Rephrase and Respond (RaR) Prompting

„Rephrase and Respond (RaR) Prompting“ je metoda, která se často používá v interaktivních dialozích nebo vzdělávacích technikách. Tato metoda zahrnuje přeformulování otázky nebo poznámky druhé osoby, aby se ujistila, že bylo správně porozuměno, nebo aby se podpořila hlubší reflexe. V pedagogickém kontextu může učitel použít RaR, aby zkontroloval porozumění studenta nebo aby ho povzbudil k dalšímu rozvíjení jeho myšlenek.

Cílem techniky RaR je zvýšit výkonnost velkých jazykových modelů (LLM) při porozumění a odpovídání na otázky položené člověkem. RaR umožňuje modelům LLM autonomně přeformulovat a rozšířit otázky před poskytnutím odpovědi, čímž řeší problém nepochopení zdánlivě jednoznačných otázek v důsledku rozdílů v interpretaci mezi lidmi a modely LLM.

RaR je implementován ve dvou formách:

  1. RaR v jednom kroku: Zde LLM přeformulují otázku a odpoví na ni v rámci jediné výzvy. Tato metoda je založena na lidské komunikační strategii přeformulování pro jasnost a souvislost. Ukázalo se, že je účinná, zejména u datových sad, které předkládají LLM nejednoznačné otázky.
  2. Dvoufázový RaR: Tento přístup zahrnuje složitější proces, kdy „přeformulovávající LLM“ nejprve přeformuluje otázku, která je poté zkombinována s původní otázkou, aby vyzvala „odpovídající LLM“. Tato metoda je výhodná pro použití přeformulovaných otázek v různých modelech, přičemž experimenty ukazují, že otázka přeformulovaná pokročilejším LLM, jako je GPT-4, může výrazně pomoci méně sofistikovanému LLM při vytváření přesnějších odpovědí.

Následující obrázek znázorňuje příklady metody Two-step RaR, kdy je otázka přeformulována a na přeformulovanou otázku je odpovězeno.

Tato metoda ukazuje, že GPT-4 dokáže postupně objasňovat pojmy, i když se mu to nepodaří při prvním pokusu, přičemž otázky se po každém přeformulování stávají propracovanějšími.

Metoda RaR porovnávána s metodou myšlenkového řetězce (Chain-of-Thought, CoT) a ukazuje, že RaR nabízí zlepšení ve scénářích, kde je metoda CoT s nulovým počtem snímků neúčinná, a také řeší nedostatky vlastní metodě CoT s několika snímky.

Zdroj:

Navrženo v dokumentuRefrázovat a reagovat: Deng a kol. z UCLA

VM