این فرآیند ترسناک هوش مصنوعی تصاویر چند پیکسلی را رمزگشایی میکند!
به گزارش کارگروه فناوری اطلاعات سایبربان ؛ فرآیند هوش مصنوعی (AI) معرفیشده از دانشگاه دوک که اخیراً توجهها را به خود جلب کرده، توانایی تبدیل تصاویر محو و چند پیکسلی را بهعکسهایی دقیق شامل جزئیاتی حیرتانگیز دارد.
فرآیند هوش مصنوعی برای پردازش تصاویر
آنچه در تصویر بالا میبینیم تصویر ورودی و محصول نهایی بوده که به یکی از تازهترین فناوریهای هوش مصنوعی مربوط میشوند. عکس سمت چپ یک تصویر محو و چند پیکسلی بوده که با ورود به بخش پردازش این فناوری به تصویر سمت راست تبدیلشده و جزئیاتی که میبینیم تماماً توسط AI بهکاررفته، اضافهشدهاند.
جزئیاتی مانند خطوط صورت، چینوچروک دور چشمها و ابعاد قسمتهای مختلف چهره فرد داخل تصویر همگی توسط این فرآیند هوش مصنوعی تولیدشدهاند و در تصویر ابتدایی هیچکدام از این جزئیات وجود نداشتند. البته نکتهای که از نگرانی در مورد این پیشرفت تازه فناوری AI کم میکند، غیرواقعی بودن تصویر تولیدی است. بهبیاندیگر فرآیند موردنظر روشی عجیب و خطرناک برای از بین بردن قسمت تار در تصاویر نیست و صورتهایی که توسط این شبکه هوش مصنوعی تولید میشوند، واقعی نبوده و خیالی هستند.
بااینوجود جالب است بدانیم که فناوری اخیر تقریباً ۸ برابر نسبت به نمونههای پیشین این تکنیک تولید تصاویر پیشرفت داشته و میتواند تا ۶۴ مرتبه کیفیت عکس ورودی را افزایش دهد.
جزئیات دستاورد اخیر
دانشمندان این فرآیند هوش مصنوعی را پالس (PULSE) نامگذاری کردهاند و همانطور که سینتیا رودین (Cynthia Rudin)، استاد علوم کامپیوتری از دانشگاه دوک گفته، بههیچوجه سابقه نداشته که یک شبکه AI بتواند این سطح از جزئیات را از تصویری کاملاً کلی و چند پیکسلی به وجود آورد.
برعکس آنچه تصور میشود، هوش مصنوعی پالس در طی فرآیندی معکوس صورتها و تصاویر دقیقی را تولید میکند که در صورت تار شدن و کاهش تعداد پیکسلها، بهعکس اولیه چند پیکسلی شبیه میشوند. درواقع یک سطح ۱۶ در ۱۶ از پیکسلها میتواند با پردازش در شبکه اخیر به تصویری با تعداد پیکسل ۱۰۲۴ در ۱۰۲۴ تبدیلشده و در کوتاهترین زمان ممکن، بیش از یکمیلیون پیکسل به آن اضافه شود.
اما فرآیند هوش مصنوعی مورداستفاده توسط تیم رودین در نوع خود شگفتانگیز است؛ این فناوری سیستمی به نام شبکه مولد متقابل (GAN) را برای تولید تصاویر باکیفیت به کار میبرد. سیستم GAN دو شبکه عصبی یا همان موتورهای یادگیری هوش مصنوعی که از عملکرد مغز انسان تقلید میکنند را در مقابل هم قرار داده و با تمرین دادن این شبکهها روی یک نمونه واحد از تصاویر پیکسلی، به نتیجه دلخواه میرسد. از این طریق، یکی از شبکهها تصاویر خیالی موردنیاز را تولید کرده و شبکه عصبی دیگر بهصورت همزمان تشخیص میدهد که کدامیک از تصاویر تولیدی با عکس چند پیکسلی اولیه مطابقت دارند.
کاربردها
با بهکارگیری سیستم شبکه مولد متقابل، دانشمندان برخلاف تکنیکهای پیشین عکسهایی را تولید میکنند که هیچ قسمت محو و تاری ندارند. از طرف دیگر موفقیت اصلی این فرآیند هوش مصنوعی به جستجوی آن برای مشخص کردن تعداد زیادی کاندید برای تصویر چند پیکسلی اولیه مربوط میشود؛ درحالیکه اگر قرار بود شبکههای عصبی بهکاررفته تنها به دنبال یک تصویر مشخص و کاملاً مطابق با ویژگیهای موردنیاز میگشتند، چنین موفقیتی حاصل نمیشد.
بر اساس تازهترین اطلاعات، سیستمهای GAN روزبهروز پیشرفتهتر میشوند و مدتی پیش هم کمپانی عظیم انویدیا (Nvidia) با بهرهگیری از همین شبکه توانسته بود تصاویر عجیب و شگفتانگیزی از انسانهایی را تولید کند که هرگز وجود خارجی نداشتهاند. سیستم مورداستفاده انویدیا با ترکیب عکس انسانهای واقعی، افرادی را به وجود میآورد که واقعاً وجود ندارند؛ سیستم هوش مصنوعی پالس هم با تکنیکی مشابه، عکسهای محو و چند پیکسلی را بهعنوان منبع بهکاربرده و تصاویری مطابق خواست اولیه را ارائه میکند.
البته این تصاویر تنها بهصورت انسانها محدود نمیشوند و توسعهدهندگان پالس میگویند که فرآیند هوش مصنوعی آنها میتواند تصاویر چند پیکسلی مربوط به هر سوژهای را پردازش کند. چنین کاربردی میتواند تکنولوژی موردنظر را برای استفاده در حوزههای مختلفی ازجمله ستارهشناسی، پزشکی، پردازش تصاویر ماهوارهای و حوزههای مشابه آماده کند.
تحقیقات تیم دانشگاه دوک در کنفرانس ۲۰۲۰ CVPR ارائهشده مقاله مربوط به این دستاورد بهزودی منتشر خواهد شد.