Za rok může být AI chytřejší než my

před 1 týden 28

Komentář

Umělá inteligence se dnes v testech znalostí téměř vyrovná vědcům. Jak daleko je bod, kdy člověka definitivně překoná?

Sestry protestující proti umělé inteligenci v nemocnicích; San Francisco, duben 2024

Do konce příštího roku bude umělá inteligence chytřejší než kterýkoliv člověk. Alespoň podle byznysmana Elona Muska, který tuto vizi před pár týdny zveřejnil na své sociální síti X. Musk nemá zrovna pověst spolehlivého prognostika: například v roce 2016 předpověděl, že do dvou let ujede jeho elektromobil Tesla na jedno nabití vzdálenost z New Yorku do Los Angeles a jeho raketa SpaceX doletí na Mars. Ani jedno se dosud nestalo. A u své současné předpovědi si Musk ponechal zadní vrátka: možná k tomu nedojde, pokud vývoj umělé inteligence narazí limity dané nedostatkem hardwaru nebo elektrického proudu nutného k provozu obřích generativních modelů, jako je GPT-4 firmy OpenAI, Claude 3 Opus společnosti Anthropic – nebo Grok AI startupu xAI, který založil sám Musk.

Přesto není hned nutné se podobným prognózám vysmívat. V polovině dubna se objevila The 2024 AI Index Report, zpráva o pokroku v oblasti umělé inteligence vydávaná každoročně Stanfordovou univerzitou. Vyjmenovává mimo jiné oblasti, v nichž umělá inteligence lidské schopnosti již překonala. Patří k nim klasifikace obrazu (třeba schopnost odlišit zhoubný nádor od nezhoubného) – zde stroj předčil člověka již kolem roku 2016. Nebo porozumění jazyku a jím zprostředkovaným složitým zadáním v oblastech od matematiky po právo a etiku – tady stroj dotáhl člověka v roce 2022. V dalších sférách se schopnosti stroje lidským již blíží: jde třeba o skutečné intuitivní pochopení toho, co je zachyceno na obrázcích, a porozumění komplikované vyšší matematice.

Z toho pramení i nutnost ve stále kratších časových intervalech zdokonalovat testy, které by schopnosti AI zhodnotily a porovnaly s lidskými. Jednou z nejnovějších metod je test označovaný zkratkou GPQA zahrnující více než 400 otázek. Výsledky stojí za pozornost: jsou-li pomocí GPQA testováni odborníci se vzděláním na úrovni doktorátu a vystaveni otázkám ve svém oboru, dosahují průměrné úspěšnosti 65 procent. Mimo svůj obor dosahují 34 procent, ačkoliv mají během zkoušky přístup k internetu. Systémy umělé inteligence loni dosahovaly 30-40 procent napříč obory. A letos? Zmíněný Claude 3 firmy Anthropic se blýskl 60 procenty.

Přečtěte celý článek