Zrychlení vědeckého pokroku pomocí umělé inteligence
Sdílet na sociálních sítích:
Laboratoř FutureHouse vyvíjí AI agenty pro automatizaci klíčových kroků ve vědeckém výzkumu, čímž se snaží urychlit objevování.

Několik výzkumníků se v posledních 50 letech zabývalo komplexním pohledem na vědecký pokrok a dospělo ke znepokojivému závěru: vědecká produktivita klesá. Objevy, které dříve přicházely rychleji a levněji, nyní vyžadují více času, finančních prostředků a větší týmy.
Mezi různými vysvětleními tohoto zpomalení je i to, že s rostoucí komplexností a specializací výzkumů vědci musejí trávit více času studiem publikací, navrhováním propracovaných experimentů a analýzou dat.
Výzkumná laboratoř FutureHouse, financovaná filantropickými dary, se nyní snaží urychlit vědecký výzkum pomocí platformy umělé inteligence (AI), která je navržena k automatizaci mnoha kritických kroků na cestě k vědeckému pokroku. Platforma se skládá z řady AI agentů specializovaných na úkoly, jako je vyhledávání informací, syntéza informací, návrh chemické syntézy a analýza dat.
Zakladatelé FutureHouse, Sam Rodriques PhD '19 a Andrew White, věří, že poskytnutím přístupu k těmto AI agentům všem vědcům mohou prolomit největší překážky ve vědě a pomoci vyřešit některé z nejnaléhavějších problémů lidstva.
„Přirozený jazyk je skutečným jazykem vědy,“ říká Rodriques. „Jiní lidé budují základní modely pro biologii, kde modely strojového učení hovoří jazykem DNA nebo proteinů, a to je silné. Objevy však nejsou reprezentovány v DNA ani proteinech. Jediný způsob, jak víme, jak reprezentovat objevy, formulovat hypotézy a uvažovat, je pomocí přirozeného jazyka.“
Ve svém doktorandském výzkumu na MIT se Rodriques snažil pochopit vnitřní fungování mozku v laboratoři profesora Eda Boydena.
„Celá myšlenka za FutureHouse byla inspirována tímto dojmem, který jsem získal během svého doktorátu na MIT, že i kdybychom měli všechny informace, které potřebujeme vědět o tom, jak mozek funguje, nevěděli bychom to, protože nikdo nemá čas číst veškerou literaturu,“ vysvětluje Rodriques. „I kdyby to dokázali přečíst, nedokázali by to sestavit do ucelené teorie. To byl základní stavební kámen skládačky FutureHouse.“
Rodriques ve své disertační práci z roku 2019 psal o potřebě nových druhů rozsáhlých výzkumných kolaborací, a ačkoli po promoci nějakou dobu vedl laboratoř na Francis Crick Institute v Londýně, zjistil, že se přiklání k rozsáhlým problémům ve vědě, které by žádná jednotlivá laboratoř nezvládla.
„Zajímalo mě, jak automatizovat nebo zvětšit rozsah vědy a jaké druhy nových organizačních struktur nebo technologií by odemkly vyšší vědeckou produktivitu,“ říká Rodriques.
Když byl v listopadu 2022 uveden Chat-GPT 3.5, Rodriques viděl cestu k silnějším modelům, které by samy mohly generovat vědecké poznatky. Přibližně ve stejnou dobu se také setkal s Andrewem Whitem, výpočetním chemikem na University of Rochester, kterému byl poskytnut předčasný přístup k Chat-GPT 4. White vytvořil prvního velkého jazykového agenta pro vědu a výzkumníci spojili síly a založili FutureHouse.
Zakladatelé začali s vytvořením samostatných AI nástrojů pro úkoly, jako je vyhledávání literatury, analýza dat a generování hypotéz. Začali sběrem dat a v září 2024 nakonec vydali PaperQA, který Rodriques nazývá nejlepším světovým AI agentem pro vyhledávání a shrnutí informací ve vědecké literatuře. Přibližně ve stejnou dobu vydali Has Anyone, nástroj, který umožňuje vědcům zjistit, zda někdo provedl specifické experimenty nebo prozkoumal specifické hypotézy.
„Jen jsme tak seděli a ptali se: ‚Jaké druhy otázek si my jako vědci klademe pořád?‘“ vzpomíná Rodriques.
Když FutureHouse oficiálně zahájil provoz své platformy 1. května tohoto roku, některé ze svých nástrojů přejmenoval. Paper QA se nyní jmenuje Crow a Has Anyone se nyní jmenuje Owl. Falcon je agent, který dokáže shromažďovat a prověřovat více zdrojů než Crow. Další nový agent, Phoenix, může používat specializované nástroje k pomoci výzkumníkům při plánování chemických experimentů. A Finch je agent navržený k automatizaci objevování řízeného daty v biologii.
20. května společnost předvedla víceagenční pracovní postup pro vědecké objevy, aby automatizovala klíčové kroky vědeckého procesu a identifikovala nového terapeutického kandidáta na suchou věkem podmíněnou makulární degeneraci (dAMD), hlavní příčinu nevratné slepoty na celém světě. V červnu FutureHouse vydal ether0, 24B otevřený váhový model uvažování pro chemii.
„Tyto agenty musíte skutečně vnímat jako součást většího systému,“ říká Rodriques. „Brzy budou agenty pro vyhledávání literatury integrovány s agentem pro analýzu dat, agentem pro generování hypotéz, agentem pro plánování experimentů a všechny budou navrženy tak, aby spolupracovaly bezproblémově.“
Dnes má přístup k agentům FutureHouse každý na platformě platform.futurehouse.org. Spuštění platformy společnosti vyvolalo v oboru nadšení a začínají přicházet zprávy o vědcích, kteří agenty používají k urychlení výzkumu.
Jeden z vědců FutureHouse použil agenty k identifikaci genu, který by mohl být spojen s polycystickým ovariálním syndromem, a k navržení nové hypotézy léčby tohoto onemocnění. Další výzkumník v Národní laboratoři Lawrence Berkeley použil Crow k vytvoření AI asistenta schopného vyhledávat v databázi výzkumu PubMed informace související s Alzheimerovou chorobou.
Vědci v jiné výzkumné instituci použili agenty k provedení systematických přehledů genů relevantních pro Parkinsonovu chorobu a zjistili, že agenty FutureHouse fungovaly lépe než obecné agenty.
Rodriques říká, že vědci, kteří agenty vnímají méně jako Google Scholar a více jako inteligentního vědeckého asistenta, z platformy získají maximum.
„Lidé, kteří hledají spekulace, mají tendenci z Chat-GPT o3 hloubkového výzkumu získat více, zatímco lidé, kteří hledají skutečně věrné rešerše literatury, mají tendenci z našich agentů získat více,“ vysvětluje Rodriques.
Rodriques si také myslí, že FutureHouse se brzy dostane do bodu, kdy jeho agenty budou moci použít surová data z vědeckých prací k otestování reprodukovatelnosti výsledků a ověření závěrů.
V delším horizontu, aby vědecký pokrok pokračoval, Rodriques říká, že FutureHouse pracuje na zabudování implicitních znalostí do svých agentů, aby dokázali provádět sofistikovanější analýzy, a zároveň jim dává schopnost používat výpočetní nástroje k prozkoumání hypotéz.
„Došlo k tolika pokrokům v oblasti základních modelů pro vědu a jazykových modelů pro proteiny a DNA, že nyní musíme našim agentům poskytnout přístup k těmto modelům a všem dalším nástrojům, které lidé běžně používají k provádění vědecké práce,“ říká Rodriques. „Vytvoření infrastruktury, která umožní agentům používat více specializovaných nástrojů pro vědu, bude klíčové.“
Související články
Chemici z MIT zvyšují efektivitu klíčového enzymu fotosyntézy
Špatný zrak v kojeneckém věku může pomoci organizovat zrakové dráhy v mozku
Letní čtení z MIT 2025 (Pokračování)
Sdílet na sociálních sítích:
Komentáře