بازسازی صدای انسان توسط هوش مصنوعی
به گزارش واحد فناوری اطلاعات سایبربان؛ فناوری هوش مصنوعی با سرعت زیادی در حال پیشرفت است. پژوهشگران به طور پیوسته در تلاش هستند تا قابلیت مکالمه و تصمیمگیری را در این فناوری پیشرفت دهند. ساخت سامانهای که صحبتهای انسان را متوجه میشود ساده است؛ اما تولید صدای انسان برای آنها چالشهای بسیاری را به همره دارد. هماکنون صداهای تولید شده توسط هوشهای مصنوعی بسیار مصنوعی بوده و نمیتوانند به خوبی با بسیاری از کاربران ارتباط برقرار کنند.
آزمایشگاه دیپمایند گوگل (Deep Mind)، در گذشته هوش مصنوعی آلفاگو (AlphaGo) را به وجود آورد و موفق شد قهرمان بازی تختهای گو را شکست بدهد. محققان این شرکت به تازگی اعلام کردند در حال کار روی نوعی فناوری به نام ویونت (WaveNet) هستند که به هوشهای مصنوعی اجازه میدهد، صدایی مانند لحن طبیعی گفتار انسان ایجاد بکنند.
گوگل در فناوری ویونت، روی فناوری متن به گفتار1 (text-to-speech) برای تولید صدایی طبیعیتر از گذشته برای محصولات خود تمرکز کرده است.
هوش مصنوعی ویونت با استفاده از صدای ضبط شده از سخنرانهای انگلیسی و چینی آموزش دیده شد و برای این کار حجم زیادی از پردازشها را انجام داد که نشان میدهد. احتمالاً زمان زیادی تا بهره بردی نهایی از آن باقیمانده است. ویونت از شبکهی عصبی کانولوشن (Convolutional) استفاده میکند. این شبکهی اصلی در الگوریتمهای یادگیری عمیق استفاده شده و توسط دادههای موجود آموزش میبیند، سپس میتواند از آموزشهای خود برای تجزیهوتحلیل یا تولید دادههای جدید استفاده کند. یکی از چالشهای این روش انجام پردازشهای آن است؛ زیرا باید هزاران پیشبینی مختلف بر اساس دادههای موجود صورت بگیرند که آنها نیز ممکن است خود نتیجهی انجام پیشبینیهایی در گذشته باشند.
صدای تولید شده توسط ویونت به بسیار طبیعیتر از نمونههای مشابه قبلی هست؛ اما هنوز نمیتواند به طبیعی انسانها صدا صحبت بکند. در مقابل این فناوری حتی اگر متنی را دریافت نکند، میتواند یک خروجی قابلقبول تولید بکند.
صحبت و تولید صدای انسانها تنها کاربرد ویونت نیست. محققان در حال آزمایش این فناوری برای تولید صدای موسیقی نیز هستند.
________________________
1- متن به گفتار، برنامهای است که متن ورودی را به صدای انسان میخواند. این نوع برنامه برای تبدیل متن به پرونده صوتی (کتاب گویا)، تلفظ کلمات در نرمافزارهای واژهنامه، خواندن صفحه رایانه و نیز تلفن هوشمند مخصوصاً برای کاربران نابینا توسط نرمافزارهای صفحه خوان کاربرد دارد.