Paralyzovaný muž mluví a zpívá díky rozhraní mozek-počítač s umělou inteligencí
Sdílet na sociálních sítích:
Nová technologie umožňuje lidem s poruchou řeči přirozenou konverzaci v reálném čase pomocí rozhraní mozek-počítač.

Ztráta řeči v důsledku neurologického onemocnění, jako je ALS, má dalekosáhlé následky, které zasahují do všech oblastí každodenního života. Od sdílení vtipů s rodinou až po pouhé požádání o pomoc. Výzkumný tým z University of California, Davis, nyní představil nový systém rozhraní mozek-počítač (BCI), který otevírá cestu k přirozené konverzaci v reálném čase pro lidi, kteří nemohou mluvit.
Tato technologie nepřevádí pouze myšlenky na text. Místo toho překládá mozkové signály, které by normálně řídily svaly používané k řeči, čímž umožňuje uživatelům „mluvit“ a dokonce „zpívat“ prostřednictvím počítače, téměř okamžitě.
Srdcem systému jsou čtyři mikroelektrodové pole chirurgicky implantované do části mozku zodpovědné za produkci řeči. Tato miniaturní zařízení zachycují nervovou aktivitu, která vzniká, když se někdo snaží mluvit. Signály jsou poté zaslány do dekodéru poháněného umělou inteligencí, který je převede na slyšitelnou řeč během pouhých deseti milisekund. Je to tak rychlé, že to působí přirozeně, jako běžná konverzace.
Obzvláště pozoruhodné je, že systém dokáže rekonstruovat vlastní hlas uživatele díky algoritmu pro klonování hlasu, který byl trénován na nahrávkách pořízených před nástupem ALS. To znamená, že digitální hlas osoby zní jako ona sama, nikoli jako generický počítačový hlas. Systém dokonce rozpoznává, když se uživatel snaží zpívat, a může změnit výšku tónu tak, aby odpovídala jednoduchým melodiím. Dokáže také rozpoznat vokální nuance, jako je kladení otázek, zdůrazňování slov nebo zařazování interjekcí, jako jsou „aah“, „ooh“ nebo „hmm“. To vše dohromady vede k mnohem expresivnější a lidsky znějící konverzaci, než jakou mohly nabídnout předchozí technologie.
Proces začíná tím, že se účastník pokusí vyslovit věty zobrazené na obrazovce. Jak se snaží vytvořit každé slovo, elektrody zachytí vzorce aktivity stovek neuronů. Umělá inteligence se učí mapovat tyto vzory na specifické zvuky a rekonstruuje řeč v reálném čase. Tento přístup umožňuje jemné ovládání rytmu a tónu řeči, čímž dává uživateli možnost přerušit, zdůraznit nebo klást otázky stejně jako každý jiný.
Jedním z nejpozoruhodnějších výsledků studie UC Davis bylo, že posluchači dokázali pochopit téměř 60 procent syntetizovaných slov ve srovnání se pouhými čtyřmi procenty bez BCI. Systém si také poradil s novými, smyšlenými slovy, která nebyla součástí jeho trénovacích dat, což ukazuje jeho flexibilitu a přizpůsobivost.
Možnost komunikovat v reálném čase, vlastním hlasem a osobností, je pro lidi žijící s paralyzí zásadní změnou. Tým UC Davis zdůrazňuje, že tato technologie umožňuje uživatelům být více zapojeni do konverzací. Mohou přerušovat, rychle reagovat a vyjadřovat se s nuancemi. To je velký posun od dřívějších systémů, které pouze překládaly mozkové signály do textu, což často vedlo k pomalým, ztuhlým výměnám, které spíše připomínaly psaní zpráv než mluvení.
Jak říká David Brandman, neurochirurg zapojený do studie, náš hlas je základní součástí naší identity. Jeho ztráta je devastující, ale tento typ technologie nabízí skutečnou naději na obnovení této základní součásti toho, kým jsme.
Ačkoli tyto první výsledky jsou slibné, výzkumníci rychle zdůrazňují, že technologie je stále v rané fázi. Zatím byla testována pouze u jednoho účastníka, takže je potřeba více studií, aby se zjistilo, jak dobře funguje u ostatních, včetně lidí s různými příčinami ztráty řeči, jako je mrtvice. Klinická studie BrainGate2 v UC Davis Health pokračuje v zapojování účastníků, aby dále zdokonalila a otestovala systém.
Obnova přirozené, expresivní řeči u lidí, kteří ztratili hlas, je jedním z nejvýznamnějších pokroků v technologii rozhraní mozek-počítač. Tento nový systém z UC Davis ukazuje, že je možné vrátit konverzaci v reálném čase zpět do života lidí postižených paralyzé. Ačkoli je ještě třeba vykonat mnoho práce, dosavadní pokrok dává lidem šanci znovu se spojit se svými blízkými a světem kolem nich způsobem, který se skutečně cítí jako jejich vlastní.
Související články
Jak zakázat Gemini AI na Androidu a zachovat kontrolu nad svými aplikacemi
Simulační systém PhysicsGen učí roboty manipulaci s předměty
Dárcovská nadace profesora Larsona zřizuje prestižní profesuru v oblasti dat, systémů a společnosti
Sdílet na sociálních sítích:
Komentáře