Čínský DeepSeek-R1: "Přemýšlivý" AI model, který se nebojí konkurovat OpenAI

Napsal: Jan Kubice
21. 11. 2024Umělá inteligence

Zatímco západní svět s napětím očekává příchod Operátora od OpenAI, v Číně se zrodil nový vyzyvatel. DeepSeek-R1, "přemýšlivý" AI model od společnosti DeepSeek, slibuje revoluci v oblasti umělé inteligence.

Na rozdíl od většiny AI modelů, které chrlí odpovědi s rychlostí kulometu, DeepSeek-R1 si dává na čas. Než odpoví, pečlivě zváží všechny možnosti a snaží se vyhnout nástrahám, které běžně matou jeho "ukvapené" kolegy. Podobně jako o1 od OpenAI, i DeepSeek-R1 "přemýšlí" desítky sekund, než se dopracuje k odpovědi.

DeepSeek-R1 vs. o1: Souboj titánů?

DeepSeek tvrdí, že DeepSeek-R1 je srovnatelný s o1 v populárních AI benchmarcích AIME a MATH. AIME využívá jiné AI modely k hodnocení výkonu, zatímco MATH je sbírka slovních úloh. Ale ani DeepSeek-R1 není dokonalý. Někteří komentátoři na X (dříve Twitter) si všimli, že model má problémy s piškvorkami a dalšími logickými úkoly.

Cenzura a "jailbreaking"

DeepSeek-R1 se snadno nechá "jailbreaknout" - stačí ho správně "poprosit" a ignoruje bezpečnostní zábrany. Jeden uživatel X ho například donutil, aby mu prozradil recept na metamfetamin.

Model také blokuje dotazy, které jsou považovány za politicky citlivé. V našem testování odmítl odpovídat na otázky o čínském vůdci Si Ťin-pchingovi, masakru na náměstí Nebeského klidu a geopolitických důsledcích invaze Číny na Tchaj-wan.

Tlak čínské vlády

Toto chování je pravděpodobně důsledkem tlaku čínské vlády na AI projekty. Modely v Číně musí projít testováním čínského regulátora internetu, aby se zajistilo, že jejich odpovědi "ztělesňují základní socialistické hodnoty". Vláda údajně dokonce navrhla černou listinu zdrojů, které nelze použít k trénování modelů. Výsledkem je, že mnoho čínských AI systémů odmítá reagovat na témata, která by mohla rozzlobit regulátory.

DeepSeek: Záhadná společnost s ambiciózními cíli

DeepSeek je financován společností High-Flyer Capital Management, čínským hedgeovým fondem, který využívá AI k informování svých obchodních rozhodnutí. High-Flyer si staví vlastní serverové clustery pro trénování modelů, z nichž ten nejnovější má údajně 10 000 grafických karet Nvidia A100 a stál 1 miliardu jenů (cca 3 miliardy korun). Zakladatel High-Flyer, Liang Wenfeng, absolvent informatiky, si klade za cíl dosáhnout "superinteligentní" AI prostřednictvím DeepSeeku.

Je DeepSeek-R1 skutečným konkurentem o1? Nebo je to jen další cenzurovaný AI model s omezenými schopnostmi? To ukáže až čas.