Vědci z MIT zveřejnili výkonný open-source AI model nazvaný Boltz-1, který by mohl výrazně urychlit biomedicínský výzkum a vývoj léků. Boltz-1, vyvinutý týmem výzkumníků z MIT Jameel Clinic for Machine Learning in Health, je prvním plně open-source modelem, který dosahuje špičkového výkonu srovnatelného s AlphaFold3, modelem od Google DeepMind, který předpovídá 3D struktury proteinů a dalších biomolekul.
Hlavními vývojáři Boltz-1 byli absolventi MIT Jeremy Wohlwend a Gabriele Corso, spolu s výzkumným spolupracovníkem MIT Jameel Clinic Saro Passarem a profesory elektrotechniky a informatiky z MIT Reginou Barzilay a Tommim Jaakkolou. Wohlwend a Corso představili model 5. prosince na akci v MIT Stata Center, kde uvedli, že jejich konečným cílem je podpořit globální spolupráci, urychlit objevy a poskytnout robustní platformu pro rozvoj biomolekulárního modelování.
„Doufáme, že to bude výchozí bod pro komunitu,“ řekl Corso. „Existuje důvod, proč tomu říkáme Boltz-1 a ne Boltz. Tohle není konec. Chceme co největší příspěvek od komunity.“
Proteiny hrají zásadní roli v téměř všech biologických procesech. Tvar proteinu úzce souvisí s jeho funkcí, takže pochopení struktury proteinu je klíčové pro návrh nových léků nebo inženýrství nových proteinů se specifickými funkcemi. Vzhledem k extrémně komplexnímu procesu, kterým se dlouhý řetězec aminokyselin proteinu složí do 3D struktury, bylo přesné předpovídání této struktury po desetiletí velkou výzvou.
AlphaFold2 od DeepMind, který vynesl Demisi Hassabisovi a Johnovi Jumperovi Nobelovu cenu za chemii 2024, používá strojové učení k rychlému předpovídání 3D struktur proteinů, které jsou tak přesné, že se nedají odlišit od těch, které experimentálně určili vědci. Tento open-source model byl používán akademickými i komerčními výzkumnými týmy po celém světě a podnítil mnoho pokroků ve vývoji léků.
AlphaFold3 zlepšuje své předchůdce začleněním generativního AI modelu, známého jako difúzní model, který dokáže lépe zvládat míru nejistoty spojenou s předpovídáním extrémně komplexních struktur proteinů. Na rozdíl od AlphaFold2 však AlphaFold3 není plně open-source ani není k dispozici pro komerční použití, což vyvolalo kritiku ze strany vědecké komunity a odstartovalo globální závod o vytvoření komerčně dostupné verze modelu.
Pro svou práci na Boltz-1 použili výzkumníci z MIT stejný počáteční přístup jako AlphaFold3, ale po prozkoumání základního difúzního modelu prozkoumali potenciální zlepšení. Zahrnuli ty, které nejvíce zvýšily přesnost modelu, jako jsou nové algoritmy, které zlepšují efektivitu predikce.
Spolu s samotným modelem zveřejnili open-source i celý svůj postup pro trénink a doladění, aby na Boltz-1 mohli stavět další vědci.
„Jsem nesmírně pyšná na Jeremyho, Gabrieleho, Sara a zbytek týmu Jameel Clinic za to, že se jim podařilo toto vydání uskutečnit. Tento projekt si vyžádal mnoho dní a nocí práce s neochvějnou rozhodností dostat se do tohoto bodu. Existuje mnoho vzrušujících nápadů na další zlepšení a těšíme se, že je v nadcházejících měsících sdílíme,“ říká Barzilay.
Vývoj Boltz-1 trval týmu MIT čtyři měsíce práce a mnoho experimentů. Jednou z jejich největších výzev bylo překonání nejednoznačnosti a heterogenity obsažené v Protein Data Bank, sbírce všech biomolekulárních struktur, které tisíce biologů řešily v posledních 70 letech.
„Měl jsem hodně dlouhých nocí plných zápasení s těmito daty. Hodně z toho jsou čisté znalosti dané oblasti, které si člověk prostě musí osvojit. Neexistují žádné zkratky,“ říká Wohlwend.
Nakonec jejich experimenty ukazují, že Boltz-1 dosahuje stejné úrovně přesnosti jako AlphaFold3 na rozmanité sadě komplexních predikcí biomolekulárních struktur.
„To, čeho Jeremy, Gabriele a Saro dosáhli, je vskutku pozoruhodné. Jejich tvrdá práce a vytrvalost na tomto projektu zpřístupnily predikci biomolekulárních struktur širší komunitě a zrevolucionizují pokroky v molekulárních vědách,“ říká Jaakkola.
Výzkumníci plánují pokračovat ve zlepšování výkonu Boltz-1 a snižování času potřebného k provedení predikcí. Zvou také výzkumníky, aby vyzkoušeli Boltz-1 v jejich úložišti GitHub a spojili se s ostatními uživateli Boltz-1 na jejich kanálu Slack.
„Myslíme si, že na zlepšení těchto modelů je ještě mnoho a mnoho let práce. Jsme velmi dychtiví spolupracovat s ostatními a podívat se, co s tímto nástrojem komunita udělá,“ dodává Wohlwend.
Mathai Mammen, generální ředitel a prezident Parabilis Medicines, nazývá Boltz-1 „průlomovým“ modelem. „Zveřejněním tohoto pokroku MIT Jameel Clinic a spolupracovníci demokratizují přístup k nejmodernějším nástrojům strukturální biologie,“ říká. „Toto přelomové úsilí urychlí tvorbu život měnících léků. Děkuji týmu Boltz-1 za to, že řídili tento hluboký skok vpřed!“
„Boltz-1 bude nesmírně přínosný pro mou laboratoř a celou komunitu,“ dodává Jonathan Weissman, profesor biologie na MIT a člen Whitehead Institute for Biomedical Engineering, který se na studii nepodílel. „Uvidíme celou vlnu objevů, které umožní demokratizace tohoto výkonného nástroje.“ Weissman dodává, že očekává, že open-source povaha Boltz-1 povede k široké škále kreativních nových aplikací.
Tato práce byla také podpořena grantem U.S. National Science Foundation Expeditions; klinikou Jameel; programem U.S. Defense Threat Reduction Agency Discovery of Medical Countermeasures Against New and Emerging (DOMANE) Threats; a projektem MATCHMAKERS podporovaným partnerstvím Cancer Grand Challenges financovaným Cancer Research UK a U.S. National Cancer Institute.
Související články
Šéfové technologických firem chválí Trumpův projekt umělé inteligence
Umělá inteligence změní váš trénink: Novinky ze světa fitness technologií a AI
Otázky a odpovědi: Dopad generativní AI na klima
Sdílet na sociálních sítích:
Komentáře