تبدیل افکار به گفتار، با ایمپلنت مغزی
به گزارش کارگروه فناوری اطلاعات سایبربان؛ دانشمندان از سالها قبل در تلاش هستند ایمپلنتی را توسعه بدهند که امکان خواندن امواج مغزی را فراهم بکند. برای مثال در سال 2017 یک رابط مغز و رایانه (BCI) توسعه داده شد که به داوطلب اجازه میداد با سرعت 8 کلمه در دقیقه تایپ کند.
پژوهشگران دانشگاه کالیفرنیای سانفرانسیسکو به تازگی اعلام کردند که نوع جدیدی از رابطهای مغز و رایانه را به وجود آوردهاند. این رابط با استفاده از هوش مصنوعی، امواج مغزی را به کلمات گفتاری تبدیل کرده و سرعت آن به طور میانگین 150 کلمه در دقیقه است. این میزان تقریباً با تعداد کلماتی که یک فرد سالم بیان میکند برابر است.
فناوری یاد شده در دو مرحله عمل میکند. در گام اول سیگنالهای مغزی به تحرکات مجرای صوتی انسان (vocal tract) مانند: لب، فک، زبان و حنجره تبدیل میشود. در فاز دوم، این حرکات پردازش شده به صورت گفتاری در میآیند.
البته فناوری یادشده به نصب آرایهای از الکترودها به صورت مستقیم روی مغز کاربران نیاز دارد. با وجود این، پژوهشگران شرح دادند که این دستاورد نوعی طرح اثبات مفهوم برای امکان دستیابی به گفتار طبیعی به حساب میآید.
ادوارد چانگ (Edward Chang)، رهبر تحقیقات نام برده شرح داد:
درحالی که بسیاری از تحقیقات گذشته روی رمزگشایی صدا، یا کلمات، بر اساس فعالیتهای مغری تمرکز دارند؛ اجرای این کار به تنهایی بسیار مشکل است.
چانگ گفت:
ما تلاش میکنیم به جای رمزگشایی مستقیم صدا، آن را بر اساس حرکات مجرای صوتی تولید کنیم.
به نظر میرسد به کارگیری فناوری یادشده در حالت آزمایشهای بالینی با چالشهای بسیار مواجه شود؛ زیرا درحال حاضر هیچیک از انواع الکترودهای تأیید شده توسط سازمان غذا و داروی آمریکا از ظرفیت بالای کانالها (در این جا 256 کانال) بهره نمیگیرند. با وجود این محققان معتقدند این مسئله در آینده برطرف خواهد شد.
گروههای دیگری مانند پژوهشگران آزمایشگاه «Slutzky» در نورتوسترن و آزمایشگاه نیما مسگرانی در دانشگاه کلمبیا بهطور مشابه روی تبدیل فعالیتهای مغزی دستگاه حسی (Sensory system) به گفتار با کمک شبکههای عصبی تحقیق میکنند؛ اما محققان دانشگاه کالیفرنیای سانفرانسیسکو این کار را با تحلیل فعالیت مغزی در «موتور کورتکس» (Motor cortex) انجام میدهند.
محققان شرح دادند:
با وجود این، به نظر میرسد ترکیب هر 2 روش بالا نتیجهی بهتری را در زمینه رمزگشایی امواج مغزی و تبدیل آنها فراهم میکند.
چانگ اشاره کرد:
همهی نتایج به دست آمده مانند میانگین سرعت 150 کلمه در دقیقه بر اساس اجرای مطالعات به واسطه کاشت الکترود، مستقیماً روی سر، یا سطح مغز از طریق جراحی به دست آمده است. دقیقاً برخلاف فیسبوک که ادعا میکند فناوری آنها توانایی شناسایی 100 کلمه را در دقیقه داشته؛ اما چیزی برای اثبات آن ارائه نمیدهد.
الکترودهای خارجی -که تنها روی سطح سر کاشته میشوند- توانایی ارائه دادههای دقیق را از ناحیههای کوچک ذهن ندارند. به همین دلیل است که در سال 2017 در بهترین حالت، پژوهشگران به سرعت 8 کلمه در دقیقه دست یافتند.
چانگ شرح داد که آنها در زمان آزمایش، آرایهای از الکترودها را مستقیماً روی بخش موتور کورتکس 5 داوطلب کار گذاشته بودند. آنها سپس در زمان گفتگوی بیماران با صدای بلند، شروع به ثبت دادههای سیگنالهای مغزی آنها کردند. جملات اداشده به طور خاص به گونهای منتخب بودند که صداهای زبان انگلیسی را به نمایش بگذارند.
در گام بعد، پژوهشگران به منظور رمزگشایی دقیق سیگنالهای مغزی و تبدیل آنها به حرکات مجرای صوتی از یک شبکهی عصبی بهره گرفتند. سپس با بهکارگیری یک هوش مصنوعی دیگر این نمونههای دیجیتالی را به صوت تبدیل کرده و از داوطلبان خواستند به آن گوش کنند. در این مرحله 101 جمله برای آنها پخش شد. شنوندگان موفق شدند 43 درصد از جملاتی را که از 25 کلمه تشکیل شده بودند به طور کامل تشخیص دهند. این عدد زمانی که تعداد کلمات به 50 افزایش یافت به 21 درصد رسید.
چنگ اظهار کرد که در گام بعدی آنها سعی میکنند تا یک سیستم صوتی طبیعی و قابلدرکتر به وجود آورند.
وی همچنین بیان کرد که در آزمایشی دیگر، از یک داوطلب خواسته شد؛ بدون این که هیچ صدایی از خود تولید کند، تنها به تقلید ادای کلمات بپردازد. رابط مغز و رایانه توسعه یافته در این حالت نیز توانست کلمات و جملات اداشده را تشخیص دهد. این موضوع بیان میکند میتوان از دستاورد بالا برای بازگرداندن توان گفتار، به افراد فاقد قدرت تکلم بهره گرفت.
تحقیقات روی افراد مختلف نشان داد که الگوریتم رمزگشایی تحرکات مجرای صوتی همهی انسانها با هم برابر است. بنابراین امکان ایجاد یک رمزگشای جهانی برای آن وجود دارد.
البته محققان شرح دادند که آنها در زمان آزمایش، تنها به افراد کاملاً سالم دسترسی داشتند. آنها امیدوارند در آینده بتوانند آزمایشهای بالینی خود را روی اشخاصی که توانایی گفتار ندارند نیز انجام دهند.