تحلیل تصویر چهره با کمک هوش مصنوعی در شرایط کنترل نشده
به گزارش کارگروه فناوری اطلاعات سایبربان ؛ به نقل از دانشگاه صنعتی امیرکبیر، دکتر حمید صادقی فارغالتحصیل دانشگاه صنعتی امیرکبیر و مجری طرح «شناسایی حالت چهره مستقل از شخص در تصاویر کنترلشده» عنوان کرد: تحلیل تصاویر چهره در دنیای امروز کاربردهای زیادی دارد. یکی از تحلیلهای مهم در چهره، تشخیص یا شناسایی احساسی است که فرد در چهره خود ابراز میکند (خشم، تنفر، ترس، شادی، غمگینی، تعجب و عادی) که به آن حالت چهره گفته میشود.
وی افزود: حال سؤالی که مطرح میشود این است که شناسایی حالت چهره چه کاربردی دارد که برای پاسخ به این سؤال فرض کنید یک پزشک بخواهد بهطور مداوم در طول شبانهروز شرایط بیمار را ثبت و آمار آن را بررسی کند.
وی ادامه داد: با استفاده از یک دوربین و پردازنده میتوان چهره فرد را همواره بهصورت خودکار بررسی، حالت چهره آن را شناسایی و برای پزشک ثبت کرد؛ حالت درد در چهره، یکی از حالتهای چهرهای است که میتوان برای این مسئله متصور بود.
به گفته فارغالتحصیل دانشگاه صنعتی امیرکبیر، ازایندست نیازها در دنیای اطراف ما بسیار زیاد است.
وی با اشاره به یکی از ضعفهای تشخیص حالت چهره گفت: افت کارایی روشهای موجود در مواجه با تصاویر دنیای واقعی (غیر آزمایشگاهی) یا بهاصطلاح «تصاویر کنترلشده» از ضعفهای این حوزه به شمار میرود.
وی اضافه کرد: به همین دلیل، ما در این رساله دکتری به دنبال شناسایی حالت چهره در تصاویر کنترلشده بودیم؛ یعنی تصاویری که خارج از شرایط آزمایشگاهی و در محیط واقعی ثبت میشود. بهعنوانمثال در این تصاویر فرد لزوماً بهطور مستقیم به دوربین نگاه نمیکند.
وی خاطرنشان کرد: در این تحقیق، با استفاده از هوش مصنوعی روشهای جدیدی ارائه کردیم که باعث شد تحلیل تصویر چهره هم در تصاویر کنترلشده و هم در تصاویر کنترلشده که پیچیدگی بیشتری دارند، با دقت بسیار بهتری نسبت به دیگر سامانههای موجود انجام شود.
وی عنوان کرد: روشهای جدید ارائهشده در این تحقیق، محدود به شناسایی حالت تصویر چهره نیستند و میتوانند در مسائل مختلف یادگیری ماشین نیز استفاده شوند. این ادعا با آزمایش در مسائل مختلف (مثل تشخیص نوع اشیاء) اثباتشده است.
وی بابیان اینکه یکی از مهمترین تئوریهایی که در این تحقیق مطرح شد، یک روش یادگیری متریک برای طبقهبندی ویژگیهای هیستوگرامی است، گفت: محققانی که درزمینهٔ بینایی ماشین کار میکنند، بهخوبی میدانند که ویژگیهای هیستوگرامی استفاده زیادی در این زمینهدارند و روش ارائهشده در حل این مسائل بسیار مؤثر خواهد بود.
صادقی افزود: چهرههای تصاویر کنترلشده معمولاً پیچیدگیهای زیادی دارند. مثلاً تغییرات شدید زاویه سر، پوشیدگی بخشهای مختلف چهره، شرایط نوری نامناسب، ابعاد کوچک چهره در تصویر و … همگی از عواملی هستند که دقت شناسایی حالت چهره را تحت تأثیر قرار میدهند. با این توصیف، شناسایی حالت چهره در تصاویر کنترلشده مثل یک مسئله بسیار پیچیده است.
وی افزود: در یادگیری ماشین، برای حل این مسائل بهتر است که از یادگیری مبتنی بر نمونه استفاده شود. اگر کمی پیشرفتهتر به مسئله نگاه کنیم، میتوان از یادگیری متریک بهعنوان یک رویکرد پیشرفته از یادگیری مبتنی بر نمونه در این نوع مسائل استفاده کرد. با این پیشزمینه، رویکرد یادگیری متریک برای شناسایی حالت چهره در تصاویر کنترلشده انتخاب شد.
وی خاطرنشان کرد: در شناسایی حالت چهره، ابتدا تصویر چهره با مجموعهای از اطلاعاتی که به آن بردار ویژگی گفته میشود، توصیف میشود. در ادامه از یک روش یادگیری ماشین برای طبقهبندی این ویژگی یا تعیین نوع حالت چهره استفاده میشود.
وی گفت: ویژگیهایی که در بینایی ماشین و پردازش تصویر استفاده میشوند معمولاً از جنس هیستوگرام هستند؛ به همین دلیل، در این طرح یک روش جدید یادگیری متریک جدید باهدف طبقهبندی ویژگیهای هیستوگرامی ارائه کردیم که مبنای ریاضی آن استفاده از فاصله مربع کای است.
وی ادامه داد: گام بعدی در این تحقیق این بود که بهجای استفاده از ویژگیهای متداول هیستوگرامی، یک ویژگی قابل یادگیری برای کاربرد مدنظر خود طراحی کنیم.
وی بابیان اینکه برای تحقق این هدف، یک شبکه عصبی کانولوشنی طراحی شد که ویژگیهای از جنس هیستوگرام از تصویر استخراج میکند، گفت: این شبکه عصبی از تئوری یادگیری متریک بومی ذکرشده برای شناسایی حالت چهره استفاده میکند.
به گفته وی، با استفاده از این شبکه عصبی، نهتنها بخش طبقهبندی، بلکه بخش استخراج ویژگی از تصویر هم قابلآموزش بوده و باعث میشود دقت شناسایی حالت چهره افزایش قابلتوجهی داشته باشد.
وی با اشاره به کاربرد این تحقیقات گفت: تئوریهای یادگیری متریک و همچنین شبکه عصبی کانولوشنی ارائهشده در این تحقیق در حل مسائل مختلف پردازش تصویر و بینایی ماشین قابلاستفاده است. علاوه بر مسائل حوزه بینایی ماشین، روش یادگیری متریک ارائهشده میتواند در طبقهبندی سایر ویژگیهای مبتنی بر هیستوگرام نیز استفاده شود.
وی با اشاره به مزیتهای رقابتی طرح گفت: علاوه بر دقت بالاتر نسبت به روشهای دیگر، در این پژوهش سعی شده است که پیچیدگی محاسباتی در الگوریتم طراحیشده هم پایین باشد تا پیادهسازی آن هزینه زیادی در برنداشته باشد. بهعنوانمثال، معماری شبکه عصبی پیشنهادی در این تحقیق برمبنای بخشی از شبکه عصبی کانولوشنی شناختهشده MobileNet (نه تمام این شبکه عصبی) است که محاسبات نسبتاً کمی دارد.
وی با اشاره به کاربردهای تحلیل تصویر چهره با کمک هوش مصنوعی گفت: معرفی این پروژه را با یک کاربرد پزشکی (تشخیص درد در چهره) انجام دادیم. اما روشهای ارائهشده برای شناسایی حالت چهره در این تحقیق میتوانند در کاربردهای مختلفی مانند ساخت رباتهای باقابلیت تشخیص حالت چهره انسان، ارتباط انسان با رایانه، هوشمندسازی پخش موسیقی متناسب باحالت چهره فرد و … مورداستفاده قرار گیرند.