موفقیت کامپیوترها در تشخیص چهره
به گزارش واحد فناوری اطلاعات سایبربان؛ شبکههای اجتماعی در عکسها به دنبال چهره میگشتند و ناحیه صورت را تگ میکردند؛ اما گاهی اوقات اشتباه صورت میگرفت. حالا بعد از چهار سال فیسبوک برای شناسایی تصویر در عکس، دقتی بهاندازه ۹۷% دارد.
اینیک پیشرفت بزرگ برای فیسبوک است اما این الگوریتم هنوز بهاندازه مغز انسان نمیرسد و ۳ درصد امکان خطا برایش وجود دارد. حالا اگر شخصی از ما بخواهد یک چهره آشنا را در عکسی باکیفیت پایین شناسایی کنیم قطعاً این کار را بهتر از کامپیوترها انجام خواهیم داد. حتی اگر این عکس از یک زاویه خیلی بد گرفتهشده باشد.
همیشه کامپیوترها دقیقتر از انسانها عمل میکنند و برای این موضوع کمی غیرمعمول است که قدرت تشخیص انسان بهتر است. چرا ما در این چالش بهتر عمل میکنیم و رایانهها دقیقاً چگونه چهره را تشخیص میدهند؟
مغز ما از قبل آموزشی جدی دیده است
یک قسمت از مغز ما به تشخیص چهره اختصاص دادهشده است. این قسمت fusiform gyrus نامیده میشود که این قسمت بخشی از temporal lobe و occipital lobe را شامل میشود. یادگیری تشخیص چهره انسان از زمان تولد آغاز میشود. این مهارت در روز اول زندگی نوزادان در آنها پرورش مییابد. در اوایل چهارماهگی، مغز نوزادان آماده است که مثلاً چهره عمو را از چهره عمه یا هر شخص دیگر تمیز دهد.
چشم، استخوان گونه، بینی، دهان و ابرو قسمتهای کلیدی صورت هستند که به ما کمک میکنند یکدیگر را از هم تشخیص دهیم. البته پوست هم خیلی مهم است مخصوصاً رنگ و بافت آن. قابلذکر است که مغز ما تمایل دارد کل یک چهره را پردازش کند و عمدتاً بر روی ویژگیهای فردی تمرکز نمیکند.
باوجوداین قابلیت است که میتوانیم یک چهره نیمهآشکار و یا چهره زیر روسری یا چادر را تشخیص دهیم. بااینحال، اگر یک شخص شبیه یکی دیگر را با اختلاف خیلی کم و یا چهره شخص معروف را ببینیم ممکن است برای تشخیص چهره بهعکس دیگری احتیاج پیدا کنیم. از زمان تولد مغز ما چهرهها را در خود ذخیره میکند و این ذخیرهها است که برای پردازش صورت استفاده میشود. اگر یک نفر بخواهد این الگو را رسم کند ممکن است.
پردازش صورت زمانی صورت میگیرد که مغز ما بخواهد ظاهر یک فرد را با چیزی که از قبل در خود ذخیره کرده، مقایسه کند. مثلاً اگر بینی شخص بزرگتر، لبها کوچکتر یا بزرگتر، پوست تیرهتر یا روشنتر و ... شده باشد مغز فرمان پردازش میدهد. تابهحال برایتان پیشآمده که به سفر بروید و اشخاصی را ملاقات کنید که شبیه کسانی بودند که آنان را دیدهاید ولی با نژاد متفاوت؟ دلیل این موضوع قالب صورت و نقاط کلیدی صورت است که میتواند شبیه آنها به نظر برسد.
برخی از حیوانات هم مثل سگ و میمون میتوانند چهرهها را بهخوبی از هم تشخیص دهند. اگرچه مشام قوی آنهاست که میتواند اطلاعات مفیدی دراینباره به آنها بدهد اما تصاویر بصری این حیوانات است که به آنها کمک میکند تا چهرهها را در بین سایر موجودات زنده دیگر تشخیص دهند. جالب است بدانید که سگ که بهترین دوست اکثر افراد است، نهتنها خلقوخو را بهآسانی در چهرههای ما میتواند ببیند بلکه آنها میتوانند یاد بگیرند که چگونه لبخند بزنند.
چگونه یک کامپیوتر چهره ما را تشخیص میدهد؟
چه ارتباطی بین لبخند انسان و پردازش صورت وجود دارد؟ این دو عبارت تقریباً لازمه شناسایی چهره هستند (خصوصاً برای الگوریتمهای کامپیوتر) که با هر تغییری بتواند شناسایی را بهطور کامل انجام دهد.
نرمافزار میتواند دو تصویر صورت تمامرخ را باهم مقایسه و تصویر واقعی شخص را از نقاشی تشخیص دهد. این راهکار دقیقاً مثل طراحی چهرهسازی است. آنها نقطهبهنقطه صورت را آنالیز میکنند. این نقاط به شناسایی چهره فردی ما کمک میکند. روشهای مختلفی برای تشخیص چهره وجود دارد که از ۸۰ تا ۱۵۰ نقطه بر روی چهره قابلتغییر است.
برای مثال، هنرمندان چهرهساز و نرمافزار هردو فاصله بین چشمها، پهنای بینی، عمق کاسه چشم، شکل استخوان گونه، طول خط فک و... همه را اندازهگیری میکنند.
هنگامیکه حالت چشمتان را تغییر دهید یا مدل سرتان را مثلاً کج بگیرید، تمام اندازهگیریها تغییر میکند. همانطور که بسیاری از الگوریتمهای پردازش صورت در فضای دو یا سهبعدی آنالیز میشوند. نقطه دید برای شناسایی چهره بسیار مهم است.
اگر قصد دارید ناشناس بمانید و کسی نتواند شمارا تشخیص دهد، چشمهایتان را بپوشانید و استخوان گونه خود را زیر عینک بزرگ مخفی کنید، چانه و دهان خود را برای حفظ گمنامی با یک شالگردن بپوشانید. هنگامیکه ما دستگاه FindFace را مورد آزمایش قراردادیم، آن فقط قادر بود چهرههایی که از جلو نمایان بودند را تشخیص دهد.
تصاویر بالا به شما میگوید که چگونه بتوانید دستگاههای تشخیص چهره را که تنها با عکسهای یکبعدی کار میکنند را گول بزنید. بااینحال ماه پشت ابر نمیماند و الگوریتمهای پیشرفته برای تشخیص چهره درراه هستند.
گام بعدی چیست؟
همزمان با رشد ما، آن قسمت از مغزمان هم که برای پردازش چهره است رشد میکند. توانایی تشخیص افراد بین (ما) و (شما) یکی از مهارتهای ضروری برای بقا است. کامپیوترهای مدرن هم مانند یادگیری مغز انسان، برنامهریزی خود رادارند.
برای پیشرفت نتایج سیستم پردازش صورت، توسعهدهندگان با استفاده از الگوریتمهای یادگیری خود و ...برای شناسایی عکس، راههای آنلاین مختلفی وجود دارد و این کار بهراحتی انجام میگیرد. شبکههای اجتماعی، سایتهای هاستینگ عکس، photo stocks و بسیاری از منابع دیگر هستند که با استفاده از آنها میتوانید عمل شناسایی چهره را روی آنها انجام دهید.
شناسایی چهره از زمانی که الگوریتمها با مدلهای سهبعدی شروع به کارکردند، بسیار کارآمدتر از قبل شده است. با پیشرفت برنامهنویسی، طراحی یک شبکه بر روی چهره و ادغام ضبط ویدئو با نرمافزارهای مختلف تشخیص چهره، شناسایی شخص از زوایای مختلف امکانپذیر شده است. بههرحال، قالب چهره در مغز انسان هم سهبعدی است. اگرچه این تکنولوژی همچنان درحالتوسعه است اما میتوان برای آن چندراه اختصاصی در بازار پیدا کنید.
واقعی بودنِ رندر، مانند یک معدن طلا برای صنعت بازیهای ویدئویی و شرکتهای نامبر وانی است که بهسختی تلاش میکنند کاراکترهای خود را هرچه بیشتر طبیعی نشان دهند. گامهای مهمی در این عرصه برداشتهشده است. این تکنولوژی خدمت مهمی به نرمافزارهای تشخیص چهره است.
جدا از مدلهای سهبعدی، توسعهدهندگان در قالبهای دیگری نیز فعالیت کردهاند، برای مثال: شرکت Identix یک تکنولوژی بیومتریک برای تشخیص چهره ایجاد کرد که آن را FaceIt Argus نامید. این شناساگر منحصربهفرد؛ بافت پوست، منافذ پوست، زخمها و چیزهایی نظیر اینها را آنالیز میکند. سازندگان FaceIt Argus مدعی شدهاند که شناساگر آنها قابلیت این را دارد که تفاوت بین دوقلوهای همسان را نیز تشخیص دهد؛ که چنین چیزی با استفاده از نرمافزارهای تشخیص چهره بهتنهایی ممکن نیست.
گفته میشود این سیستم نسبت به تغییرات چهره (مانند چشمک زدن، خنده یا اخم) حساس نیست و قابلیت این را دارد که برای فرد ریش و سبیل بگذارد و وی را بهاصطلاح عینکی کند. دقت شناسایی را از ۲۰ تا ۲۵% میتوان توسط نرمافزار FaceIt Argus به همراه دیگر نرمافزارهای پردازش چهره افزایش داد. از سوی دیگر ضعف این نرمافزار در تاریکی خودش را نشان میدهد و در تصاویر باکیفیت پایین و نور کم با شکست مواجه شده است.
بههرحال، برای پوشش این ایراد فناوریهای دیگری نیز وجود دارد. دانشمندان کامپیوتر در موسسه تکنولوژی Karlsruhe در آلمان روش جدیدی را توسعه دادند که با استفاده از مادونقرمز چهره افراد، در نور کم و یا حتی در تاریکی چهره را شناسایی میکند.
این تکنولوژی امضای حرارتی افراد را آنالیز میکند و با دقت نهایتاً 80%، تصاویر (مادونقرمز دور) فرد را با تصاویر معمولی تطبیق میدهد. هرچقدر تعداد تصاویر بیشتر باشد عملکرد الگوریتم موفقیتآمیزتر خواهد بود. زمانی که تعداد تصاویر قابلرؤیت تنها یک عدد باشد، دقت الگوریتم به 55% کاهش مییابد.
ساخت چنین نرمافزاری در نگاه اول آسان به نظر نمیرسد، زیرا که هیچ رابطهای بین چهره و مادونقرمز وجود ندارد. عکسی که بر اساس انتشار حرارتی ساختهشده است، از عکسهایی که در روشنایی روز گرفته میشوند بسیار متفاوت است.
قدرت این الگوریتم وابستگی زیادی به پوست، دمای محیط و حتی حالت احساسی فرد دارد. در کنار آن، تصاویر مادونقرمز رزولوشن کمتری نسبت به تصاویر معمولی دارند که این امر کار را سختتر میکند.
برای حل این مشکل، دانشمندان از «الگوریتم یادگیری ماشین» استفاده کردند و ۱۵۸۶ تصویر از ۴۲ نفر را وارد این سیستم کردند.
امروزه، فناوری تشخیص چهره تقریباً در سراسر جهان استفاده میشود. اخیراً یکی از راههای مشابه تشخیص چهره در چین برای کنترل رانندگان تاکسی بهکاربرده میشود. NEC و مایکروسافت هم ترکیبی از تشخیص چهره را در نرمافزارهایشان استفاده میکنند و IoT به متخصصان بازاریابی اجازه میدهد که از این طریق مشتریان خود را بهتر و بهتر بشناسند.
توسعه فناوری تشخیص چهره میتواند به ما کمک کند تا در مورد هر چیز که به حریم شخصی ما مربوط است تجدیدنظر کنیم. ممکن است چنین چیزی امروز و یا حتی در سال آینده هم اتفاق نیفتند اما در حال حاضر باید برای آن آماده بود.