افراد دارای مشکلات تکلم؛ سخنورانی فعال در تماس های ویدیویی
به گزارش کارگروه فناوری اطلاعات سایبربان؛ یکی از ویژگی و جنبه های تماس تصویری که ما آن را نادیده می گیریم و توجه زیادی به آن نمی کنیم نحوه جابه جایی آن میان افراد و هایلایت کردن فرد صحبت کننده می باشد.
اگر صحبت کردن ملاک ما برای برقرای ارتباط باشد، زبان های بدون صدا مانند زبان اشاره توسط الگوریتم های تماس تصویری شناسایی نمی شوند.
اما مطالعات و تحقیقات جدید گوگل می تواند این معادله را بر هم زند و تغییراتی را در آن اعمال کند.
پروژه مدنظر گوگل، ساخت موتور شناسایی است که می تواند زبان اشاره را تشخیص دهد و زمان شروع و پایان حرکات او را شناسایی کند.
مطمئنا این کار برای انسان ها آسان است. اما انجام این پروسه برای یک سیستم گرافیکی تماس ویدیویی کار دشواری خواهد بود.
طبق آخرین گزارشات منتشر شده توسط محققان شرکت گوگل، این سیستم با موفقیت و لگ های بسیار کم مورد آزمایش قرار گرفته است.
این سیستم در ابتدا ویدیو مورد نظر را در مدلی به نام PoseNet اجرا خواهد کرد. این مدل، موقعیت اعضای بدن را در هر قاب حدس می زند.
این اطلاعات بصری ساده سازی شده به مدلی فرستاده می شوند که از قبل آموزش داده شده است و تصاویر زنده را با شکل فرضی زبان اشاره مقایسه می کند.
این فرآیند ساده، دقت 80 درصدی را در پیش بینی و تشخیص زبان اشاره ثبت کرده است و با اضافه کردن برخی ویژگی ها این میزان به 91.5درصد افزایش پیدا خواهد کرد.
ارزش این میزان درصد ها زمانی مشخص می شود که می فهمیم تمایز حالت های مختلف بدن مانند سرفه یا صحبت کردن، در این سیستم عملکرد متوسطی را به ثبت رسانده است.
اما در نحوه عملکرد این سیستم، از ترفندی زیرکانه استفاده شده است.
این سیستم از یک منبع صوتی مجازی برای تولید فرکانس 20کیلو هرتز که خارج از محدوده صوتی انسان است، استفاده می کند که برای سیستم صوتی کامپیوتر قابل درک است.
این سیگنال، هر زمان که فرد مورد نظر شروع به استفاده از زبان اشاره خود کند، تولید می شود و الگوریتم شناسایی صحبت فرض را بر آن می گیرد که آن فرد با صدای بلند صحبت می کند.
این تنها نسخه آزمایشی از این پروژه است و شرایط برای استفاده نهایی از این قابلیت مهیا است.