„Self-Reflection“ je proces, kde uživatel formuluje dotaz nebo příkaz tak, aby podněcoval model k introspektivnímu přemýšlení nebo samostatné analýze. Cílem je, aby model přemýšlel o svých vlastních omezeních, možnostech a vnitřních procesech.
Například, když se mě zeptáte: „Jaký typ otázek může být pro tebe náročný zodpovědět?„, vede mě to k tomu, abych přemýšlel a popsal konkrétní situace, ve kterých mohu mít potíže. Toto sebereflexivní cvičení může být užitečné pro uživatele, aby pochopili, jaké otázky jsou mimo moje schopnosti nebo kde by mohli očekávat méně přesné odpovědi. To zároveň poskytuje příležitost pro modely umělé inteligence, aby se „zamyslely“ nad svými omezeními a možnými oblastmi pro zlepšení.

Tento diagram ilustruje architekturu umělé inteligence (AI), která je založena na konceptu sebereflexe a využívá modely strojového učení (označené jako LM, což zřejmě značí „Language Models“ – jazykové modely). Jednotlivé komponenty tohoto systému jsou:
Agent: Celkový systém nebo AI, který se skládá z několika dílčích komponent a interaguje s vnějším prostředím.
Self-reflection (LM): Tato část agenta zpracovává vnější a vnitřní zpětnou vazbu a generuje reflexivní texty. Je založen na jazykovém modelu a slouží k hlubšímu pochopení a integraci získaných zkušeností.
Evaluator (LM): Evaluator posuzuje kroky agenta (akce a rozhodnutí) na základě krátkodobé paměti (Trajectory) a dlouhodobé paměti (Experience). Tato komponenta může pomáhat optimalizovat chování agenta tím, že poskytuje vnitřní zpětnou vazbu na základě předchozích akcí.
Actor (LM): Actor je zodpovědný za provedení akcí v prostředí. Vykonává akce založené na svých zkušenostech a informacích získaných z prostředí (Obs/Reward).
Trajectory (krátkodobá paměť): Sbírá a ukládá nedávné akce a rozhodnutí, které slouží jako základ pro okamžité rozhodování a feedback.
Experience (dlouhodobá paměť): Uchovává dlouhodobé informace a zkušenosti, které pomáhají při formování strategií a rozhodnutí pro budoucí akce.
Environment: Prostředí, ve kterém agent operuje. Agent zde získává pozorování a odměny, které informují jeho rozhodnutí a akce.
Tento typ architektury může být použit v různých aplikacích, jako jsou autonomní roboti, pokročilé chatboty nebo jiné systémy AI, které vyžadují složité rozhodovací procesy a adaptabilitu na základě zpětné vazby z prostředí a vlastních zkušeností.

Na obrázku jsou zobrazeny tři příklady z různých domén, které ilustrují, jak může jazykový model provádět sebereflexi. Překlad a popis principů sebereflexe pro každý příklad:
1. Rozhodování (Decision making)
- Úkol: Jste uprostřed místnosti […] Úkol: vyčistit pánev a umístit ji na kuchyňskou linku.
- Trajektorie: Akce: vzít pánev z hořáku […] Pozorování: nic se nestalo […] Akce: vyčistit pánev v dřezu […] Pozorování: nic se nestalo.
- Hodnocení: Halucinace.
- Reflexe: […] pokusil jsem se vzít pánev z hořáku 1 […] ale pánev nebyla na hořáku 1.
- Další trajektorie: Akce: vzít pánev z hořáku 2 […] Pozorování: umístil jste pánev na linku 1.
Model identifikuje, že původní akce nevedla k očekávanému výsledku (pánev nebyla na prvním hořáku), což ho vede k úpravě akce pro dosažení úkolu.
2. Programování (Programming)
- Úkol: Dostali jste seznam dvou řetězců pouze s otevřenými ‚(‚ a zavřenými ‚)‘ závorkami […]
- Kód: def match_parens(list): […] vrátí ‚Ne‘.
- Selhání: Sebevygenerované jednotkové testy selhaly: assert match_parens(…).
- Reflexe: […] chybné, protože to pouze kontroluje celkový počet otevřených a zavřených závorek, nikoli pořadí závorek […]
Model zjistí, že jeho původní přístup k úkolu byl chybný, protože nezohlednil důležitý aspekt problému (pořadí závorek). Toto vede k úpravě logiky programu.
3. Úvaha (Reasoning)
- Úkol: Jakou profesi mají společnou John Lanchester a Alan Dean Foster?
- Myslení: […] romanopisec, novinář, kritik […] společné je romanopisec a scenárista.
- Akce: „romanopisec, scenárista“
- Hodnocení: Binární odměna: 0
- Reflexe: […] selhalo, protože jsem nesprávně předpokládal, že oba měli více společných profesí […] správně identifikovat jejich profese.
- Další úvaha: […] Takže profese, kterou mají John Lanchester a Alan Dean Foster společnou, je romanopisec.
- Akce: „romanopisec“
Model si zde uvědomuje, že jeho původní odpověď byla nedostatečná, což vedlo k nesprávnému skórování. Po dalším rozmyšlení koriguje svou odpověď na základě správné interpretace dostupných informací.

Obrázek popisuje proces vývoje řešení zahrnující sebereflexi. Postupuje od definice úkolu k vygenerování testů, internímu testování, sebereflexi a nakonec k vypracování zlepšeného řešení. Zde je popis jednotlivých kroků:
Úkol (Task): Zadání nebo problém, který má být řešen.
Navrhované řešení (Proposed Solution): Prvotní odpověď nebo řešení poskytnuté na základě zadaného úkolu.
Generování testů (Test Generation): Vytvoření testů založených na úkolu, které mají ověřit správnost navrhovaného řešení.
Interní testy (Internal Tests): Provádění vygenerovaných testů na navrhovaném řešení.
Sebereflexe (Self-reflection): Proces, během kterého systém vyhodnocuje výsledky interních testů a přemýšlí nad svými chybami a nedostatky v řešení.
Vylepšené řešení (Refined Solution): Iterativní zlepšení původního řešení na základě poznatků získaných během sebereflexe.
Diagram ukazuje, jak je tento proces integrován do iterativního cyklu zlepšování řešení. Sebereflexe tady slouží jako kritický moment, kdy systém posuzuje efektivitu svého původního řešení a podle toho se snaží o další zlepšení.
Tento model může být použit v softwarovém inženýrství, umělé inteligenci nebo jakémkoliv jiném oboru, kde je potřeba iterativního zlepšování výstupů.