Sarah Alnegheimish, doktorandka v laboratoři pro informační a rozhodovací systémy (LIDS) na MIT, se zaměřuje na zpřístupnění, transparentnost a důvěryhodnost systémů strojového učení. Její výzkum se nachází na křižovatce strojového učení a systémového inženýrství.
\nHlavním výstupem její práce je Orion, open-source framework a knihovna pro časové řady, která dokáže detekovat anomálie bez dohledu ve velkých průmyslových a provozních prostředích. Orion je navržen tak, aby byl uživatelsky přívětivý a snadno použitelný i pro ty, kteří nejsou experty na strojové učení.
\nVliv raného dětství
\nAlnegheimish vyrostla v rodině univerzitního profesora a učitelky, což v ní zanechalo hluboký respekt k volnému sdílení znalostí. Její zkušenosti s open-source zdroji ji dále utvrdily v přesvědčení, že přístupnost je klíčem k přijetí nových technologií. Magisterské studium si doplnila pomocí MIT OpenCourseWare.
\nPo absolvování King Saud University (KSU) pracovala jako výzkumnice v King Abdulaziz City for Science and Technology (KACST) v Saúdské Arábii. Díky spolupráci mezi CCES (Center for Complex Engineering Systems) v KACST a MIT začala Alnegheimish spolupracovat s profesorem Kalyanem Veeramachanenim, jehož výzkumná skupina se stala její volbou pro doktorandské studium na MIT.
\nVytvoření Orionu
\nAlnegheimishina magisterská práce se zaměřovala na detekci anomálií v časových řadách – identifikaci neočekávaných chování nebo vzorů v datech. Orion využívá statistické a modely strojového učení, které jsou průběžně protokolovány a udržovány. Uživatelé nemusí být experty na strojové učení, aby mohli kód používat. Mohou analyzovat signály, porovnávat metody detekce anomálií a zkoumat anomálie v celém programu. Framework, kód i datové soubory jsou open-source.
\nDíky open-source přístupu je dosaženo přístupnosti a transparentnosti. Každý krok v modelu je označen a prezentován uživateli, což zvyšuje důvěru v model. Orion si klade za cíl shromáždit řadu algoritmů strojového učení na jednom místě, aby je kdokoli mohl použít.
\nPřizpůsobení modelů pro detekci anomálií
\nV rámci doktorandského studia Alnegheimish zkoumá inovativní způsoby detekce anomálií s využitím Orionu. Zaměřuje se na využití předem natrénovaných modelů, což šetří čas a výpočetní náklady. Výzvou je, že detekce anomálií v časových řadách je pro tyto modely nová úloha. Alnegheimish se snaží rozšířit jejich možnosti pomocí tzv. prompt engineeringu, bez dodatečného trénování.
\nPřístupný design
\nAlnegheimish zdůrazňuje úsilí vynaložené na zpřístupnění Orionu. Klíčovým prvkem je nalezení správných abstrakcí pro práci s modely. Tyto abstrakce poskytují univerzální reprezentaci pro všechny modely se zjednodušenými komponentami. Stabilita a spolehlivost těchto abstrakcí byla ověřena po dobu šesti let. Význam současného budování systémů a modelů je zřejmý i z Alnegheimishiny práce s magisterskými studenty, kteří s pomocí Orionu dokázali vyvíjet vlastní modely.
\nAlnegheimish také zkoumala použití velkého jazykového modelu (LLM) jako prostředníka mezi uživateli a systémem. Implementovaný LLM agent umožňuje připojení k Orionu bez nutnosti znalosti detailů fungování Orionu. Uživatelé používají pouze dva příkazy: Fit (trénování modelu) a Detect (detekce anomálií).
\nOrion má již přes 120 000 stažení a přes tisíc uživatelů si ho označilo mezi své oblíbené na GitHubu.
Související články
Generativní AI pomáhá robotům skákat výše a bezpečněji přistávat
Noví roboti Hugging Face zpřístupňují AI každému doma
Badatelé MIT představují odvážné myšlenky v oblasti generativní AI
Sdílet na sociálních sítích:
Komentáře