Vytvořte si AI tutoriál na míru! Vyzkoušejte generátor tutoriálů a ušetřete čas.

OpenAI představuje o1: Model umělé inteligence, který umí myslet (nebo se tak alespoň tváří)

Sdílet na sociálních sítích:
Napsal: Jan Kubice
Umělá inteligence

OpenAI slibuje, že jeho nový model umělé inteligence o1 dokáže řešit složité problémy rychleji než člověk. Je to skutečný průlom, nebo jen další drahý trik?

Obrázek novinky

OpenAI, společnost stojící za populárním ChatGPT, právě vypustila do světa svůj nejnovější výtvor - model umělé inteligence s názvem o1. Tento model je prvním z plánované série "uvažujících" modelů, které byly trénovány k tomu, aby odpovídaly na složitější otázky rychleji, než by to dokázal člověk. Spolu s o1 přichází také o1-mini, jeho menší a levnější verze. A ano, pokud jste byli v obraze ohledně spekulací ve světě AI, tak se skutečně jedná o onen extrémně očekávaný model Strawberry.

Pro OpenAI představuje o1 krok směrem k jejich širšímu cíli - vytvoření umělé inteligence, která se podobá lidské. Z praktičtějšího hlediska je o1 lepší v psaní kódu a řešení vícekrokových problémů než předchozí modely. Na druhou stranu je jeho použití dražší a pomalejší než u GPT-4o. OpenAI označuje toto vydání o1 jako "preview", aby zdůraznila, že je stále ve vývoji.

Uživatelé ChatGPT Plus a Team získají přístup k o1-preview i o1-mini již dnes, zatímco uživatelé Enterprise a Edu se k nim dostanou začátkem příštího týdne. OpenAI plánuje zpřístupnit o1-mini všem bezplatným uživatelům ChatGPT, ale zatím nestanovila datum vydání. Přístup vývojářů k o1 je opravdu drahý: V API stojí o1-preview 15 dolarů za 1 milion vstupních tokenů (částí textu analyzovaných modelem) a 60 dolarů za 1 milion výstupních tokenů. Pro srovnání, GPT-4o stojí 5 dolarů za 1 milion vstupních tokenů a 15 dolarů za 1 milion výstupních tokenů.

Trénování o1 se zásadně liší od jeho předchůdců, jak mi sdělil vedoucí výzkumu OpenAI, Jerry Tworek, ačkoli společnost je ohledně přesných detailů mlhavá. Říká, že o1 "byl trénován pomocí zcela nového optimalizačního algoritmu a nové sady tréninkových dat, která byla speciálně pro něj upravena."

OpenAI učila předchozí modely GPT napodobovat vzory ze svých tréninkových dat. S o1 však trénovala model, aby řešil problémy sám pomocí techniky známé jako reinforcement learning (učení posilováním), která systém učí prostřednictvím odměn a trestů. Poté používá "řetězec myšlenek" ke zpracování dotazů, podobně jako lidé řeší problémy krok za krokem.

V důsledku této nové tréninkové metodologie OpenAI tvrdí, že model by měl být přesnější. "Všimli jsme si, že tento model méně halucinuje," říká Tworek. Problém však stále přetrvává. "Nemůžeme říct, že jsme halucinace vyřešili."

Hlavní věc, která odlišuje tento nový model od GPT-4o, je jeho schopnost řešit složité problémy, jako je kódování a matematika, mnohem lépe než jeho předchůdci, a zároveň vysvětlovat své uvažování, tvrdí OpenAI.

"Model je rozhodně lepší v řešení matematického testu AP než já, a to jsem na vysoké škole studoval matematiku jako vedlejší obor," říká mi hlavní výzkumný pracovník OpenAI, Bob McGrew. Říká, že OpenAI také testovala o1 proti kvalifikační zkoušce pro Mezinárodní matematickou olympiádu, a zatímco GPT-4o správně vyřešil pouze 13 procent problémů, o1 dosáhl skóre 83 procent.

V online programátorských soutěžích známých jako Codeforces competitions dosáhl tento nový model 89. percentilu účastníků a OpenAI tvrdí, že další aktualizace tohoto modelu bude fungovat "podobně jako doktorandi na náročných srovnávacích úlohách ve fyzice, chemii a biologii."

Zároveň o1 není v mnoha oblastech tak schopný jako GPT-4o. Není tak dobrý ve faktických znalostech o světě. Také nemá schopnost procházet web nebo zpracovávat soubory a obrázky. Přesto společnost věří, že představuje zcela novou třídu schopností. Byl pojmenován o1, aby naznačil "reset počítadla zpět na 1".

"Budu upřímný: Myslím, že jsme tradičně strašní v pojmenovávání," říká McGrew. "Takže doufám, že toto je první krok k novějším, rozumnějším jménům, která lépe sdělí, co děláme, zbytku světa."

Neměl jsem možnost si o1 sám vyzkoušet, ale McGrew a Tworek mi ho tento týden ukázali přes videohovor. Požádali ho, aby vyřešil tuto hádanku:

"Princezna je stejně stará, jako bude princ, až bude princezna dvakrát tak stará, jako byl princ, když byl věk princezny polovinou součtu jejich současného věku. Kolik je princi a princezně let? Uveďte všechna možná řešení této otázky."

Model se na 30 sekund zastavil a poté poskytl správnou odpověď. OpenAI navrhla rozhraní tak, aby zobrazovalo kroky uvažování, jak model přemýšlí. Co mě zaujalo, není to, že ukázal svou práci - GPT-4o to dokáže, pokud je k tomu vyzván - ale jak záměrně o1 napodoboval lidské myšlení. Fráze jako "Zajímá mě," "Přemýšlím o tom" a "Ok, podívejme se" vytvářely postupnou iluzi myšlení.

Ale tento model nepřemýšlí, a rozhodně není lidský. Tak proč ho navrhovat tak, aby se tak jevil?

OpenAI nevěří ve ztotožňování myšlení modelu AI s lidským myšlením, podle Tworeka. Rozhraní má však ukázat, jak model tráví více času zpracováním a hlubším ponořením se do řešení problémů, říká. "Existují způsoby, kterými se cítí lidštější než předchozí modely."

"Myslím, že uvidíte, že existuje spousta způsobů, kterými se cítí jaksi mimozemsky, ale jsou tu také způsoby, kterými se cítí překvapivě lidsky," říká McGrew. Model má omezený čas na zpracování dotazů, takže může říct něco jako: "Ach, dochází mi čas, rychle se dostanu k odpovědi." Na začátku, během svého řetězce myšlenek, se také může zdát, že brainstormuje, a říct něco jako: "Mohl bych udělat tohle nebo tamto, co mám dělat?"

Budování směrem k agentům

Velké jazykové modely nejsou v současné podobě zase tak chytré. V podstatě jen předpovídají sekvence slov, aby vám poskytly odpověď na základě vzorců naučených z obrovského množství dat. Vezměte si ChatGPT, který má tendenci mylně tvrdit, že slovo "strawberry" má pouze dvě R, protože slovo správně nerozděluje. Pro úplnost, nový model o1 tento dotaz zodpověděl správně.

V době, kdy se OpenAI údajně snaží získat další financování při závratném ocenění 150 miliard dolarů, její hybnost závisí na dalších výzkumných průlomech. Společnost přináší do LLM schopnosti uvažování, protože vidí budoucnost s autonomními systémy neboli agenty, které jsou schopny činit rozhodnutí a podnikat kroky vaším jménem.

Pro výzkumníky v oblasti AI je prolomení uvažování důležitým dalším krokem k inteligenci na lidské úrovni. Myšlenka je taková, že pokud je model schopen více než jen rozpoznávání vzorů, mohl by odemknout průlomy v oblastech, jako je medicína a inženýrství. Prozatím jsou však schopnosti uvažování o1 relativně pomalé, ne podobné agentům a pro vývojáře drahé na používání. Přesto OpenAI věří, že o1 představuje významný posun. "Strávili jsme mnoho měsíců prací na uvažování, protože si myslíme, že se jedná o klíčový průlom," říká McGrew. "V zásadě se jedná o nový způsob, jakým modely mohou řešit opravdu těžké problémy, což je nezbytné pro postup směrem k inteligenci na lidské úrovni." Zda se o1 skutečně stane oním přelomovým bodem, který posune umělou inteligenci na novou úroveň, nebo zda zůstane jen dalším zajímavým, ale nákladným experimentem, ukáže až čas. Jedno je však jisté - OpenAI se rozhodně nehodlá zastavit na půli cesty a bude i nadále posouvat hranice možného.


Související články

Sdílet na sociálních sítích:

Komentáře

Zatím žádné komentáře. Buďte první, kdo napíše svůj názor!