AGI je realita: Anthropic vydal důkaz

Anthropic vydal interní zprávu nazvanou „When AI Builds Itself“, která odhaluje, co se skutečně děje uvnitř firmy. Čísla z této zprávy přesvědčila mnoho lidí, že AGI (umělá obecná inteligence) už není vzdálenou budoucností, ale přítomností. Pokud ještě nemáte jasnou představu o tom, co je to umělá inteligence a jak funguje, doporučujeme začít se základy.

Co přesně znamená AGI podle praktické definice

Diskuse o AGI se obvykle zasekne u slova „obecná“. Může AI cítit? Je si vědoma sama sebe? Autor videa však nabízí praktičtější definici: AGI nastane ve chvíli, kdy předložíte modelu otevřený problém bez jasné odpovědi a model sám provede výzkum, spustí experimenty, vyzkouší různé přístupy a vrátí se s funkčním řešením. Úzká AI, která exceluje v jedné konkrétní úloze (šachový engine, doporučovací algoritmus nebo třídění e-mailů), pod tuto definici nespadá, a to bez ohledu na to, jak vysokou má úspěšnost ve své oblasti. Přehled toho, co dnes modely skutečně umí, nabízejí úkoly jazykových modelů.

Konkrétní čísla ze zprávy Anthropic

Anthropic rozděluje úlohy do čtyř kategorií podle obtížnosti: triviální, rutinní, podstatné a otevřené problémy. Otevřené problémy jsou v jejich vlastní definici „úlohy bez jasné specifikace, kde ani inženýr neví, jak by měl výsledek vypadat“. Na těchto nejtěžších úlohách zaznamenal Claude dramatický posun:

Před 6 měsíci dosahoval Claude úspěšnosti 26 % na otevřených problémech, dnes je to 76 %. Jde o nárůst o 50 procentních bodů za půl roku.
Před dvěma lety zvládal nejlepší model Anthropic úlohu trvající přibližně 4 minuty. Před rokem hodinu a půl. Letos již 12 hodin, přičemž jeden interní model pracoval 16 hodin v kuse.
Délka zvládnutelných úloh se přibližně zdvojnásobuje každé 4 měsíce.
Typický inženýr Anthropic dnes odesílá osmkrát více kódu denně než v roce 2024. Přes 80 % kódu, který Anthropic dodává, napsal přímo Claude.

AI rozhoduje lépe než lidští výzkumníci

Anthropic provedl test, při němž vzal reálné výzkumné projekty, zastavil je v rozhodovacím bodě a zeptal se AI i lidských výzkumníků, jaký by byl vhodný další krok. Výsledky ze 129 takových momentů jsou výrazné:

V listopadu 2024 AI zvolila lepší postup než člověk v 51 % případů.
V dubnu 2025 to bylo již 64 % případů.
Na optimalizaci konkrétního tréninkového kódu dosáhla nejnovější verze modelu 52násobného zrychlení, zatímco model před rokem dosahoval pouze trojnásobného.
Na problému, na němž výzkumníci pracovali týden a dosáhli 23% pokroku, AI agenti pracující nepřetržitě uzavřeli 97 % mezery.

Tři scénáře budoucího vývoje podle Anthropic

Zpráva popisuje tři možné trajektorie dalšího vývoje. Širší kontext těchto trendů přibližuje přehled technologie budoucnosti:

Scénář 1: Trend se zastaví, exponenciální křivky se vyhladí a AI zůstane velmi mocným nástrojem, ale bez dalšího skoku.
Scénář 2: Zisky se dál skládají, AI odvádí stále více práce, ale lidé stále určují směr výzkumu a hodnotí výsledky. Podle autora videa je to stav, ve kterém již dnes žijeme.
Scénář 3: AI se stane plně schopnou budovat svého vlastního nástupce. Rychlost pokroku pak přestane být omezena lidmi a bude záviset pouze na dostupném výpočetním výkonu.

Anthropic přiznává, že nikdo nedokáže s jistotou říct, na které trajektorii se právě nacházíme. Zároveň varuje, že drobné chyby v zarovnání (alignment) dnešních modelů se mohou při iterativním sebezdokonalování AI násobit a zároveň se stávat méně a méně viditelnými. Proč tato nejistota vyvolává obavy i u odborníků, vysvětluje článek o tom, proč se lidé bojí umělé inteligence.

Problém závodů a nemožnost zastavení

Zpráva se věnuje i tomu, proč Anthropic nehodlá jednostranně přibrzdit, přestože explicitně říká, že zpomalení by pravděpodobně bylo prospěšné. Analogie se studenou válkou je v textu přímo zmíněna: jaderné smlouvy fungovaly díky fyzické inspekci raketových sil, tzv. principu „trust but verify“ (důvěřuj, ale prověřuj). Tréninkové běhy AI jsou však, slovy Anthropic, mnohem snazší skrýt než raketová sila. Není co ukazovat satelitu. Budování podobného systému vzájemné důvěry zabralo v případě jaderných zbraní desetiletí a Anthropic říká, že tento čas nemáme. Otázky bezpečnosti rozvíjí také analýza bezpečnostních principů a šifrování dat velkých jazykových modelů.

Co to znamená pro jednotlivce

Zpráva i samotný autor videa zdůrazňují jeden klíčový posun: pokud samotná realizace práce (psaní kódu, tvorba obsahu, rutinní úkoly) přestává být vzácná, cennou komoditou se stává úsudek, vkus a schopnost poznat, který problém vůbec stojí za to AI předložit. Rozvíjet tyto kompetence pomáhají AI Skills – přehled klíčových dovedností pro práci s umělou inteligencí. Anthropic ve zprávě uvádí, že jedinou oblastí, kde jsou lidé stále lepší, je schopnost vidět širší kontext a přemýšlet za hranice bezprostředního úkolu. Propast mezi těmi, kdo AI skutečně využívají jako tým agentů, a těmi, kdo ji používají jako chytrý vyhledávač, se přitom každý měsíc prohlubuje. Anthropic odhaduje, že 100členná firma by mohla začít odvádět práci organizace o 10 000 nebo dokonce 100 000 lidech – k tomu, jak implementovat AI do firem a skutečně z těchto možností těžit, existují konkrétní postupy.

Zpráva Anthropic „When AI Builds Itself“ je jedním z nejpřímočařejších dokladů toho, kde se vývoj AI skutečně nachází. Pokud chcete pochopit, co tato čísla znamenají pro vaši práci i každodenní rozhodování, je nejvyšší čas přestat přihlížet a začít aktivně rozvíjet schopnosti, které AI zatím nahradit nedokáže: strategické myšlení, úsudek a schopnost klást správné otázky. Praktickým prvním krokem je naučit se prompt engineering – tedy jak s AI modely efektivně komunikovat a vytěžit z nich maximum. Inspiraci, jak to dělají úspěšné firmy, nabízejí také případové studie úspěšných AI SaaS projektů.

Pro hlubší pochopení kontextu doporučujeme také tyto externí zdroje: kompletní zprávu Anthropic „When AI Builds Itself“, přehled výzkumu AI bezpečnosti na AI Alignment Forum, nebo analýzy vývoje AI na Our World in Data.