بهبود دید رایانه ای با الگوریتم های بازگشتی
به گزارش کارگروه فناوری اطلاعات سایبربان، به نقل از «techxplore»؛ در طی چند سال گذشته شبکه های عصبی کانولوشنال کلاسیک (cCNN1)، پیشرفت های عظیمی را در فناوری دید رایانه ای (computer vision) به وجود آورده اند. بسیاری از این الگوریتم ها می توانند اشیا موجود در محیط پیرامون را به صورت تصاویری با کیفیت و دقت بسیار بالا طبقه بندی کنند.
با وجود این در هنگام به کارگیری آنها در جهان واقعی مانند خودروهای بی راننده یا روباتیک، تصویر برداری به ندرت در شرایط نوری مناسب انجام می گیرد. این در حالی است که الگوریتم های یاد شده در اغلب موارد باید بتوانند ویژگی های اشیا، جهت، نوع حرکت و نویز را حتی در شرایط نوری و کیفیت تصویری بسیار پایین تشخیص دهند.
اگرچه شبکه عصبی کانولوشنال کلاسیک قادر است نویز تصویر را حذف و کیفیت نهایی را افزایش دهد؛ اما امکان ترکیب داده های چندین فریم یا توالی ویدئوها را ندارد. به همین دلیل توانایی انسان ها در تشخیص تصاویری با کیفیت پایین به سادگی از ماشین ها فراتر می رود. تیل هارتمن (Till S. Hartmann)، محقق عصب شناس دانشکده پزشکی هاروارد، به تازگی رویکرد جدیدی از شبکه عصبی مذکور را به منظور مقابله با محدودیت های مطرح شده، معرفی کرد.
هارتمن بیش از یک دهه روی شیوه درک و پردازش داده های بصری انسان تحقیق کرد. وی همچنین در طول چند سال گذشته شروع به بررسی شباهت های عمیق الگوریتم های یاد شده با سیستم بصری ذهن کرده است.
در ویژوال کورتکس (Visual Cortex) –بخشی از مغز که وظیفه ی پردازش ورودی های بصری را برعهده دارد- اکثر اتصالات عصبی به صورت بازخوردی و جانبی ایجاد شده اند. این مسئله نشان می دهد پردازش های بصری انجام شده توسط ذهن بسیار بیشتر از الگوریتم یاد شده است. تحقیقات یاد شده هارتمن در زمینه آزمایش لایه های کانولوشنال که با پردازش های بازگشتی ترکیب می شود، نشان داد، این مسئله برای پردازش اطلاعات بصری ذهن انسان حیاتی به نظر می رسد.
هارتمن در رویکرد یاد شده از اتصالات بازگشتی در شبکه های عصبی کانولوشنال استفاده کرد تا از رفع بهتر نویزها در شرایط نوری ضعیف و کیفیت پایین تصاویر اطمینان حاصل کند. زمانی که الگوریتم کانولوشنال بازگشتی (recurrent CNNs) ایجاد شده در زمینه حذف اختلال دنباله ای از ویدئوهای ضبط شده در شب، به کار گرفته شد، نتیجه ی به دست آمده، بسیار بهتر از نمونه ی کلاسیک بود.
دستاورد مذکور حافظه فضایی محدودی را برای لایه های مختلف الگوریتم فراهم می کنم. به همین سبب هوش مصنوعی امکان یادگیری شیوه ادغام اطلاعات در گذر زمان را به دست می آورد. این ویژگی زمانی که کیفیت سیگنال ها کم بوده و برای مثال تصاویری یا ویدئویی ضعیفی در دسترس باشند، مفید واقع خواهد شد.
هارتمن توضیح داد در گام بعدی قصد دارد روی الگوریتم توسعه داده شده را در محیط های حقیقی و کاربردهای زمان واقعی مورد آزمایش قرار دهد.
- classical convolutional neural networks