Iniciativa pro překlady s využitím umělé inteligence pomáhá ukrajinským studentům
Sdílet na sociálních sítích:
Ukrajinští studenti překládají vzdělávací materiály MIT OpenCourseWare do ukrajinštiny s pomocí AI.

Válka na Ukrajině narušuje vzdělávání milionů ukrajinských středoškolských a vysokoškolských studentů. Mnozí se proto obracejí na online zdroje, včetně MIT OpenCourseWare, součásti MIT Open Learning, která nabízí vzdělávací materiály z více než 2 500 kurzů MIT pro bakaláře a magistry.
Pro Sofii Lipkevychovou, studentku posledního ročníku střední školy, a další studenty, se MIT OpenCourseWare stalo cenným zdrojem pro studium klíčových předmětů. Nicméně, i když mnoho ukrajinských studentů studuje angličtinu, mnozí z nich nemají dostatečné jazykové znalosti na pochopení a využití často velmi technického a komplexního obsahu a materiálů OpenCourseWare.
„Na mé škole jsem na vlastní oči viděla, jak jazyková bariéra brání mnoha ukrajinským studentům v přístupu ke světovému vzdělávání,“ říká Lipkevychová.
Tento problém se jí podařilo řešit jako účastnici Ukrajinské akademie pro vedení a technologie (ULTA), kterou založili ukrajinští studenti MIT Dima Yanovsky a Andrii Zahorodnii. Během léta 2024 na ULTA pracovala Lipkevychová na rozšíření prohlížeče, které překládalo videa na YouTube v reálném čase. Jelikož MIT OpenCourseWare byl hlavním zdrojem vzdělávacích materiálů pro studenty účastnící se ULTA, inspirovalo ji to k přímému překládání přednášek OpenCourseWare a k zpřístupnění těchto překladů na webových stránkách OpenCourseWare a na YouTube kanálu.
Přestože již od roku 2004 existovaly některé překlady vzdělávacích zdrojů MIT OpenCourseWare, tyto počáteční překlady byly prováděny ručně několika globálními partnery bez efektivity nejnovějších nástrojů umělé inteligence. V průběhu času se tyto programy staly neudržitelnými a byly ukončeny.
„Byli jsme nadšeni, že jsme se dostali do kontaktu s ULTA,“ říká Newton. „Chyběla nám živá překladatelská komunita a těšíme se na ‚druhou fázi‘ překladů.“
Tým ULTA vybral kurzy k překladu na základě poptávky mezi ukrajinskými studenty, se zaměřením na základní předměty, které jsou nezbytné pro pokročilé studium – zejména ty, pro které je nedostatek kvalitních materiálů v ukrajinském jazyce. Tým začal s překladem titulků k videopřednáškám a dosud přeložil tyto kurzy: 18.06 (Lineární algebra), 2.003SC (Inženýrská dynamika), 5.60 (Termodynamika a kinetika), 6.006 (Úvod do algoritmů) a 6.0001 (Úvod do informatiky a programování v Pythonu). Spolupracovali také s Andym Eskenazim, doktorandem na Katedře letectví a kosmonautiky MIT, na překladu 16.002 (Jak navrhovat téměř cokoli - edice Siemens NX).
Tým ULTA vyvinul hned několik nástrojů, které pomáhají překonávat jazykové bariéry. Pro PDF obsah MIT OpenCourseWare dostupný prostřednictvím programu ULTA vytvořili specializovaný nástroj, který používá rozpoznávání optických znaků k rozpoznávání LaTeX v dokumentech – jako jsou zadání úkolů a další materiály – a poté použili několik velkých jazykových modelů k jejich překladu, přičemž zachovali technickou přesnost. Tým vytvořil slovník technických termínů používaných v kurzech a jejich odpovídajících ukrajinských překladů, aby zajistil správnost a konzistenci formulace. Každý překlad prochází také lidským přezkoumáním, aby se dále zajistila přesnost a vysoká kvalita.
U video obsahu tým nejprve vytvořil rozšíření prohlížeče, které dokáže v reálném čase překládat titulky videí na YouTube. Nakonec spolupracovali s ElevenLabs a implementovali jejich pokročilý editor dabingu AI, který zachovává tón, tempo a emoční projev původního mluvčího. Přednášky se překládají v editoru dabingu ElevenLabs a poté se zvuk nahraje na YouTube kanál MIT OpenCourseWare.
Tým v současné době dokončuje překlad zvuku pro kurz 9.13 (Lidský mozek), který vyučuje profesorka MIT Nancy Kanwisher. Lipkevychová říká, že si tento kurz vybrali pro jeho interdisciplinární povahu a atraktivitu pro široké spektrum studentů.
Tento překladatelský projekt na Ukrajině zdůrazňuje transformační potenciál nejnovějších překladatelských technologií, vycházející z experimentu MIT OpenCourseWare z roku 2023, který využíval prototyp dabingu Google Aloud AI na několika kurzech, včetně kurzu profesora MIT Patricka Winstona Jak mluvit. Pokročilé možnosti editoru dabingu použitého v tomto projektu otevírají možnosti pro mnohem větší rozmanitost jazykových nabídek v materiálech MIT OpenCourseWare.
„Očekávám, že za pár let se ohlédneme zpět a uvidíme, že to byl okamžik, kdy se věci pro OpenCourseWare změnily, aby byly skutečně použitelné pro celý svět,“ říká Newton.
Komunitou vedené jazykové překlady materiálů MIT OpenCourseWare slouží jako příklad vysokého dopadu síly licence Creative Commons OpenCourseWare , která dává každému právo upravovat materiály tak, aby vyhovovaly jeho potřebám, a šířit tyto úpravy do světa.
V současné době na platformě MIT OpenCourseWare neexistuje způsob, jak rychle identifikovat, která videa jsou dostupná v jakých jazycích. MIT OpenCourseWare však pracuje na začlenění této funkce do svých webových stránek a na rozšiřování počtu nabídek v různých jazycích.
„Tento projekt představuje více než jen překlad,“ říká Lipkevychová. „Umožňujeme tisícům Ukrajinců budovat dovednosti, které budou nezbytné pro budoucí obnovu země. Doufáme také, že tento model spolupráce bude možné rozšířit na jiné jazyky a instituce a vytvořit tak šablonu pro zpřístupnění vysoce kvalitního vzdělávání po celém světě.“
Související články
Studenti MIT proměňují vize v realitu: projekty v Africe
Duke University Press se připojí k programu MIT Press Direct to Open pro publikování monografií s otevřeným přístupem
Studentka Aria Eppinger: Informatika, biologie a láska k Jane Austenové
Sdílet na sociálních sítích:
Komentáře