Vezměte si například řízení dopravy v rušném městě. AI systém by se mohl naučit ovládat křižovatky s určitými rychlostními limity, počtem jízdních pruhů a dopravními vzory. Ale co když se podmínky změní? Co když se změní rychlostní limit nebo se na silnici objeví nečekaná překážka? Standardní modely posilovaného učení by mohly v takových situacích selhat.
Vědci z MIT ale přicházejí s řešením! Vyvinuli nový algoritmus, který strategicky vybírá ty nejlepší úkoly pro trénování AI agentů, aby mohli efektivně plnit všechny úkoly v rámci souboru souvisejících úkolů. V případě řízení dopravy by každý úkol mohl být jednou křižovatkou v prostoru úkolů, který zahrnuje všechny křižovatky ve městě.
Zaměřením na menší počet křižovatek, které nejvíce přispívají k celkové efektivitě algoritmu, tato metoda maximalizuje výkon a zároveň udržuje nízké náklady na trénování.
Vědci zjistili, že jejich technika byla v řadě simulovaných úkolů 5 až 50krát efektivnější než standardní přístupy. Toto zvýšení efektivity pomáhá algoritmu naučit se lepší řešení rychlejším způsobem, což v konečném důsledku zlepšuje výkon AI agenta.
"S velmi jednoduchým algoritmem jsme byli schopni dosáhnout neuvěřitelného zlepšení výkonu tím, že jsme přemýšleli jinak," říká vedoucí autorka Cathy Wu. "Algoritmus, který není příliš složitý, má větší šanci na přijetí komunitou, protože se snáze implementuje a snáze se ostatním chápe."
Tato nová technika by mohla vést k vývoji spolehlivějších a efektivnějších AI systémů pro širokou škálu aplikací, od řízení dopravy po robotiku a medicínu.
Související články
Šéfové technologických firem chválí Trumpův projekt umělé inteligence
Umělá inteligence změní váš trénink: Novinky ze světa fitness technologií a AI
Otázky a odpovědi: Dopad generativní AI na klima
Sdílet na sociálních sítích:
Komentáře