Vytvořte si AI tutoriál na míru! Vyzkoušejte generátor tutoriálů a ušetřete čas.

Umělá inteligence předpovídá umístění prakticky libovolného proteinu v lidské buňce

Sdílet na sociálních sítích:
Napsal: Jan Kubice
Věda

Nová metoda využívající AI dokáže předpovědět polohu proteinů v buňkách, což urychlí diagnostiku nemocí a vývoj léků.

Obrázek novinky

Umělá inteligence předpovídá umístění prakticky libovolného proteinu v lidské buňce

\n

Nesprávná poloha proteinu v buňce může přispívat k řadě onemocnění, jako je Alzheimerova choroba, cystická fibróza a rakovina. V jediné lidské buňce se však nachází přibližně 70 000 různých proteinů a jejich variant. Vzhledem k tomu, že vědci obvykle dokáží v jednom experimentu testovat jen několik z nich, je ruční identifikace umístění proteinů extrémně nákladná a časově náročná.

\n

Nová generace výpočetních technik se snaží tento proces zefektivnit pomocí modelů strojového učení, které často využívají datové soubory obsahující tisíce proteinů a jejich umístění, měřené v několika buněčných liniích. Jedním z největších takových datových souborů je Human Protein Atlas, který katalogizuje subcelulární chování více než 13 000 proteinů ve více než 40 buněčných liniích. Ale i přes svou enormní velikost Human Protein Atlas prozkoumal pouze asi 0,25 procenta všech možných kombinací proteinů a buněčných linií v rámci databáze.

\n

Nyní výzkumníci z MIT, Harvardovy univerzity a Broad Institute of MIT a Harvard vyvinuli nový výpočetní přístup, který dokáže efektivně prozkoumat zbývající neprozkoumaný prostor. Jejich metoda dokáže předpovědět umístění libovolného proteinu v libovolné lidské buněčné linii, i když jak protein, tak buňka nikdy předtím nebyly testovány.

\n

Jejich technika jde o krok dále než mnoho metod založených na AI, protože lokalizuje protein na úrovni jedné buňky, nikoli jako průměrnou hodnotu napříč všemi buňkami specifického typu. Tato lokalizace na úrovni jedné buňky by například mohla přesně určit umístění proteinu v konkrétní rakovinové buňce po léčbě.

\n

Výzkumníci zkombinovali jazykový model proteinů se speciálním typem modelu počítačového vidění, aby zachytili bohaté detaily o proteinu a buňce. Uživatel nakonec obdrží obraz buňky s označenou částí, která ukazuje předpověď modelu, kde se protein nachází. Protože lokalizace proteinu je indikátorem jeho funkčního stavu, tato technika by mohla výzkumníkům a klinickým lékařům pomoci efektivněji diagnostikovat nemoci nebo identifikovat cíle pro léky, a zároveň umožnit biologům lépe pochopit, jak komplexní biologické procesy souvisí s lokalizací proteinů.

\n

„Tyto experimenty s lokalizací proteinů by se daly provádět na počítači, aniž byste se museli dotknout laboratorního stolu, a doufejme, že byste si ušetřili měsíce úsilí. I když byste si stále museli ověřit předpověď, tato technika by mohla sloužit jako počáteční screening toho, co je třeba testovat experimentálně,“ říká Yitong Tseo, postgraduální studentka programu Výpočetní a systémová biologie na MIT a spoluautorka článku o tomto výzkumu.

\n

Tseo se v článku připojuje ke spoluautorovi Xinyi Zhang, postgraduálnímu studentovi na katedře elektrotechniky a informatiky (EECS) a Eric and Wendy Schmidt Center v Broad Institute; Yunhao Bai z Broad Institute; a vedoucím autorům Fei Chen, docentce na Harvardu a člence Broad Institute, a Caroline Uhler, Andrew and Erna Viterbi profesorky inženýrství v EECS a MIT Institute for Data, Systems, and Society (IDSS), která je také ředitelkou Eric and Wendy Schmidt Center a výzkumnicí v MIT's Laboratory for Information and Decision Systems (LIDS). Výzkum vyšel dnes v časopise Nature Methods.

\n

Spolupracující modely

\n

Mnoho existujících modelů predikce proteinů dokáže provádět predikce pouze na základě dat o proteinu a buňce, na kterých byly trénovány, nebo nedokážou přesně určit umístění proteinu v jediné buňce.

\n

Aby překonali tato omezení, výzkumníci vytvořili dvoudílnou metodu pro predikci subcelulární lokace neviděných proteinů, nazvanou PUPS.

\n

První část využívá model proteinové sekvence k zachycení vlastností proteinu určujících lokalizaci a jeho 3D strukturu na základě řetězce aminokyselin, které ho tvoří.

\n

Druhá část zahrnuje model inpaintingu obrazu, který je určen k vyplnění chybějících částí obrazu. Tento model počítačového vidění se dívá na tři obarvené obrazy buňky, aby shromáždil informace o stavu této buňky, jako je její typ, individuální rysy a zda je pod stresem.

\n

PUPS spojuje reprezentace vytvořené každým modelem, aby předpověděl, kde se protein nachází v jedné buňce, a pomocí dekóderu obrazu vytvoří označený obrázek, který ukazuje předpovídanou lokalizaci.

\n

„Různé buňky v rámci buněčné linie vykazují různé charakteristiky a náš model dokáže tento nuance pochopit,“ říká Tseo.

\n

Uživatel zadá sekvenci aminokyselin, které tvoří protein, a tři obrazy buněčného barvení – jeden pro jádro, jeden pro mikrotubuly a jeden pro endoplazmatické retikulum. Pak PUPS udělá zbytek.

\n

Hloubkové porozumění

\n

Výzkumníci během procesu učení použili několik triků, aby naučili PUPS, jak kombinovat informace z každého modelu takovým způsobem, aby mohl učinit odhad umístění proteinu, i když tento protein ještě neviděl.

\n

Například během tréninku přidělí modelu vedlejší úkol: explicitně pojmenovat oddíl lokalizace, jako je buněčné jádro. To se provádí vedle primárního úkolu inpaintingu, aby se pomohlo modelu efektivněji učit.

\n

Dobrá analogie by mohla být učitel, který žádá své studenty, aby nakreslili všechny části květiny a vedle toho napsali jejich jména. Tento dodatečný krok pomohl modelu zlepšit jeho obecné porozumění možným buněčným oddílům.

\n

Kromě toho skutečnost, že PUPS je trénován současně na proteinech a buněčných liniích, mu pomáhá rozvíjet hlubší porozumění tomu, kde v buněčném obrazu se proteiny mají tendenci lokalizovat.

\n

PUPS dokonce dokáže sám pochopit, jak různé části sekvence proteinu samostatně přispívají k jeho celkové lokalizaci.

\n

„Většina ostatních metod obvykle vyžaduje, abyste nejprve měli barvení proteinu, takže jste jej již viděli ve vašich tréninkových datech. Náš přístup je unikátní v tom, že dokáže zobecnit napříč proteiny a buněčnými liniemi současně,“ říká Zhang.

\n

Protože PUPS dokáže zobecnit na neviděné proteiny, může zachytit změny lokalizace způsobené jedinečnými proteinovými mutacemi, které nejsou zahrnuty v Human Protein Atlas.

\n

Výzkumníci ověřili, že PUPS dokáže předpovědět subcelulární lokalizaci nových proteinů v neviděných buněčných liniích provedením laboratorních experimentů a porovnáním výsledků. Kromě toho, ve srovnání s referenční metodou AI, PUPS vykazoval v průměru menší chybu predikce napříč testovanými proteiny.

\n

V budoucnu chtějí výzkumníci vylepšit PUPS tak, aby model mohl porozumět interakcím protein-protein a provádět predikce lokalizace pro více proteinů v buňce. Dlouhodobě chtějí umožnit PUPS provádět predikce v termínech živé lidské tkáně, nikoli kultivovaných buněk.

\n

Tento výzkum byl financován Eric and Wendy Schmidt Center v Broad Institute, National Institutes of Health, National Science Foundation, Burroughs Welcome Fund, Searle Scholars Foundation, Harvard Stem Cell Institute, Merkin Institute, Office of Naval Research a Department of Energy.

Související články

Sdílet na sociálních sítích:

Komentáře

Zatím žádné komentáře. Buďte první, kdo napíše svůj názor!