Na rozdíl od většiny AI modelů, které chrlí odpovědi s rychlostí kulometu, DeepSeek-R1 si dává na čas. Než odpoví, pečlivě zváží všechny možnosti a snaží se vyhnout nástrahám, které běžně matou jeho "ukvapené" kolegy. Podobně jako o1 od OpenAI, i DeepSeek-R1 "přemýšlí" desítky sekund, než se dopracuje k odpovědi.
DeepSeek-R1 vs. o1: Souboj titánů?
DeepSeek tvrdí, že DeepSeek-R1 je srovnatelný s o1 v populárních AI benchmarcích AIME a MATH. AIME využívá jiné AI modely k hodnocení výkonu, zatímco MATH je sbírka slovních úloh. Ale ani DeepSeek-R1 není dokonalý. Někteří komentátoři na X (dříve Twitter) si všimli, že model má problémy s piškvorkami a dalšími logickými úkoly.
Cenzura a "jailbreaking"
DeepSeek-R1 se snadno nechá "jailbreaknout" - stačí ho správně "poprosit" a ignoruje bezpečnostní zábrany. Jeden uživatel X ho například donutil, aby mu prozradil recept na metamfetamin.
Model také blokuje dotazy, které jsou považovány za politicky citlivé. V našem testování odmítl odpovídat na otázky o čínském vůdci Si Ťin-pchingovi, masakru na náměstí Nebeského klidu a geopolitických důsledcích invaze Číny na Tchaj-wan.
Tlak čínské vlády
Toto chování je pravděpodobně důsledkem tlaku čínské vlády na AI projekty. Modely v Číně musí projít testováním čínského regulátora internetu, aby se zajistilo, že jejich odpovědi "ztělesňují základní socialistické hodnoty". Vláda údajně dokonce navrhla černou listinu zdrojů, které nelze použít k trénování modelů. Výsledkem je, že mnoho čínských AI systémů odmítá reagovat na témata, která by mohla rozzlobit regulátory.
DeepSeek: Záhadná společnost s ambiciózními cíli
DeepSeek je financován společností High-Flyer Capital Management, čínským hedgeovým fondem, který využívá AI k informování svých obchodních rozhodnutí. High-Flyer si staví vlastní serverové clustery pro trénování modelů, z nichž ten nejnovější má údajně 10 000 grafických karet Nvidia A100 a stál 1 miliardu jenů (cca 3 miliardy korun). Zakladatel High-Flyer, Liang Wenfeng, absolvent informatiky, si klade za cíl dosáhnout "superinteligentní" AI prostřednictvím DeepSeeku.
Je DeepSeek-R1 skutečným konkurentem o1? Nebo je to jen další cenzurovaný AI model s omezenými schopnostmi? To ukáže až čas.
Související články
Google se snaží pomocí AI rozluštit komunikaci delfínů
První autonomní AI agent je tady, ale stojí to za rizika?
Umělá inteligence zlepšuje plánování letecké mobility
Sdílet na sociálních sítích:
Komentáře