Inteligentní systém řízení pomáhá autonomním dronům udržet si kurz i v nejistém prostředí
Představte si autonomní dron, který přepravuje vodu k hašení požáru v Sierra Nevadě. Náhlé poryvy větru by ho mohly snadno strhnout z kurzu. Rychlá adaptace na tyto neznámé vlivy za letu představuje obrovskou výzvu pro řídicí systém dronu.
Aby pomohli takovému dronu, výzkumníci z MIT vyvinuli nový adaptivní řídicí algoritmus založený na strojovém učení, který minimalizuje odchylky od zamýšlené trajektorie v nepředvídatelných podmínkách, jako je silný vítr.
Na rozdíl od standardních přístupů nová technika nevyžaduje, aby programátor dronu předem znal strukturu těchto nejistých poruch. Místo toho se umělá inteligence řídicího systému učí vše potřebné z malého množství pozorovacích dat shromážděných během pouhých 15 minut letu.
Důležité je, že technika automaticky určuje, který optimalizační algoritmus by měla použít k adaptaci na poruchy, což zlepšuje přesnost sledování trajektorie. Vybere algoritmus, který nejlépe vyhovuje geometrii specifických poruch, kterým dron čelí.
Výzkumníci trénují svůj řídicí systém k provádění obou úkolů současně pomocí techniky zvané meta-učení, která učí systém, jak se přizpůsobit různým typům poruch.
Dohromady tyto prvky umožňují adaptivnímu řídicímu systému dosáhnout o 50 procent menší chyby sledování trajektorie než základní metody v simulacích a lépe fungovat s novými rychlostmi větru, které neviděl během tréninku.
V budoucnu by tento adaptivní řídicí systém mohl pomoci autonomním dronům efektivněji doručovat těžké balíky i přes silný vítr nebo monitorovat oblasti náchylné k požárům v národních parcích.
„Současné učení těchto komponent je tím, co dává naší metodě její sílu. Využitím meta-učení může náš regulátor automaticky dělat volby, které budou nejlepší pro rychlou adaptaci,“ říká Navid Azizan, asistentka profesorky Esther a Harolda E. Edgertona na MIT v oboru strojírenství a Institutu pro data, systémy a společnost (IDSS).
Azizan je na článku spolu s hlavní autorkou Sunbochen Tang, postgraduální studentkou na katedře letectví a kosmonautiky, a Haoyuan Sun, postgraduální studentkou na katedře elektrotechniky a informatiky. Výzkum byl nedávno prezentován na konferenci Learning for Dynamics and Control.
Nalezení správného algoritmu
Typicky řídicí systém obsahuje funkci, která modeluje dron a jeho okolí a zahrnuje některé existující informace o struktuře potenciálních poruch. Ve skutečném světě plném nejistých podmínek je však často nemožné tuto strukturu navrhnout předem.
Mnoho řídicích systémů používá adaptační metodu založenou na populárním optimalizačním algoritmu, známém jako gradientní sestup, k odhadu neznámých částí problému a k určení, jak udržet dron co nejblíže jeho cílové trajektorii během letu. Gradientní sestup je však pouze jeden algoritmus z větší rodiny dostupných algoritmů, známých jako zrcadlový sestup.
„Zrcadlový sestup je obecná rodina algoritmů a pro každý daný problém může být jeden z těchto algoritmů vhodnější než jiné. Jde o to, jak vybrat ten správný algoritmus pro váš problém. Našimi metodami tuto volbu automatizujeme,“ říká Azizan.
Ve svém řídicím systému výzkumníci nahradili funkci, která obsahuje nějakou strukturu potenciálních poruch, neuronovou síťovou model, která se učí aproximaci z dat. Tímto způsobem nemusí mít předem danou strukturu rychlostí větru, se kterými by se dron mohl setkat.
Jejich metoda také používá algoritmus k automatickému výběru správné funkce zrcadlového sestupu při učení neuronového síťového modelu z dat, místo předpokladu, že uživatel již má ideální funkci vybranou.
„Výběr dobré funkce generující vzdálenost pro konstrukci správné adaptace zrcadlového sestupu velmi ovlivňuje získání správného algoritmu k redukci chyby sledování,“ dodává Tang.
Učení se adaptaci
I když se rychlost větru, kterému může dron čelit, může měnit pokaždé, když vyletí, neuronová síť a zrcadlová funkce regulátoru by měly zůstat stejné, takže je nemusí být pokaždé přepočítávány.
Aby se jejich regulátor stal flexibilnějším, výzkumníci používají meta-učení, které ho učí adaptovat se na řadu rodin rychlostí větru během tréninku.
„Naše metoda se dokáže vypořádat s různými cíli, protože pomocí meta-učení se můžeme efektivně učit sdílenou reprezentaci prostřednictvím různých scénářů z dat,“ vysvětluje Tang.
Uživatel nakonec zadá do řídicího systému cílovou trajektorii a ten kontinuálně v reálném čase přepočítává, jak by měl dron produkovat tah, aby ho udržel co nejblíže této trajektorii a zároveň se přizpůsobil nejistým poruchám, s nimiž se setkává.
V simulacích i v reálných experimentech výzkumníci ukázali, že jejich metoda vedla k výrazně nižší chybě sledování trajektorie než základní přístupy s každou testovanou rychlostí větru.
„I když jsou poruchy větru mnohem silnější, než jsme viděli během tréninku, naše technika ukazuje, že je stále dokáže úspěšně zvládnout,“ dodává Azizan.
Tým nyní provádí hardwarové experimenty k testování svého řídicího systému na skutečných dronech s různými větrnými podmínkami a dalšími poruchami.
Chtějí také rozšířit svou metodu tak, aby mohla zvládat poruchy z více zdrojů najednou. Změny rychlosti větru by například mohly způsobit posun váhy balíku, který dron přepravuje, zejména když dron nese tekuté náklady.
Chtějí také prozkoumat kontinuální učení, takže se dron může přizpůsobit novým poruchám, aniž by bylo nutné ho znovu proškolit na datech, která již viděl.
„Navid a jeho spolupracovníci vyvinuli průlomovou práci, která kombinuje meta-učení s konvenčním adaptivním řízením, aby se učili nelineární vlastnosti z dat. Klíčem k jejich přístupu je použití technik zrcadlového sestupu, které využívají základní geometrii problému tak, jak to předchozí práce nedokázaly. Jejich práce může významně přispět k návrhu autonomních systémů, které musí fungovat v komplexním a nejistém prostředí,“ říká Babak Hassibi, profesor elektrotechniky a počítačových a matematických věd na Caltechu, který se na této práci nepodílel.
Tento výzkum byl částečně podpořen společností MathWorks, laboratoří MIT-IBM Watson AI Lab, centrem MIT-Amazon Science Hub a programem MIT-Google pro inovace v oblasti výpočetní techniky.
Související články
Generativní AI pomáhá robotům skákat výše a bezpečněji přistávat
Noví roboti Hugging Face zpřístupňují AI každému doma
Badatelé MIT představují odvážné myšlenky v oblasti generativní AI
Sdílet na sociálních sítích:
Komentáře