تبدیل تصاویر دو بعدی به صحنههای سه بعدی به وسیله هوش مصنوعی
به گزارش کارگروه فناوری اطلاعات سایبربان:
محققان حوزه هوش مصنوعی در سالهای اخیر همواره تلاش کردهاند برای به حداعلی رساندن این تکنولوژی آن را طوری آموزش دهند که به جای صرفاً دیدن محیط اطراف به صورت ترکیبی از پیکسلها، آن را همانند انسان مشاهده کرده و یادگیری کنند. انسانها وقتی به محیط اطراف نگاه میکنند در مغزشان ترکیبی از چیزهایی که واقعا چشم میبیند و تصورات ذهنی را پردازش میکنند. مثلا اگر ما یک ماشین را از روبرو ببینیم میتوانیم تصور کنیم که این خودرو قسمتهای دیگر و زوایای دیگری نیز دارد حتی اگر در حال حاضر چشم ما آن زوایا را مشاهده نکند و با مشاهده خودرو از چندین زاویه میتوانیم حجم کلی و سه بعدی آن را تصور کنیم.
یکی از آسانترین روشها برای خنداندن یک نوزاد پوشاندن صورت با دستها و سپس کنار بردن آنها یا اصطلاحاً بازی "دالی موشه" است. سیستم یادگیری مغز انسان با انجام موارد مشابهی همچون این بازی یاد میگیرد که حتی اگر دست ها صورت را پوشانده باشند همچنان چهره شخص در پشت دستها وجود دارد. کاری که محققین DeepMind با هوش مصنوعی خود کردهاند مشابه این فرآیند یادگیری مغز انسان در کودکی است. این هوش مصنوعی جدید میتواند حدس بزند که اشیا زوایای دید دیگری داشته و آن زوایای مختلف چه شکلی هستند حتی اگر آن صحنه را ندیده باشد.
راهکار این شرکت برای آموزش هوش مصنوعی خود CQN ( شبکهی جستجوی مولد یاGenerative Query Netwrok) نام دارد که یک شبکهی عصبی برای آموزش تصورکردن صحنههای مختلف یک سوژه از زوایای متفاوت به هوش مصنوعی است. به صورت خلاصه، ابتدا به این هوش مصنوعی تصاویر دو بعدی و تخت از یک صحنه نمایش داده میشود و سپس سیستم سعی میکند تا زوایای دیگر آن عکس و صحنههای سه بعدی را تولید کند. نکتهی بسیار مهم در این هوش مصنوعی جدید شرکت DeepMind این است که این کار را بدون هیچگونه داده ورودی علامتگذاری شده توسط انسان و دانستههای قبلی انجام میدهد. این سیستم تنها با مشاهده چند عکس ساده از یک محیط میتواند حدس بزند که صحنهی سه بعدی آن چگونه است.
مثلا میتوانید از یک مکعب عکس بگیرید و از هوش مصنوعی بخواهید آن عکس را از یک زاویه متفاوت به شما نشان بدهد که شامل تغییر نورپردازی، سایههای سوژه و همچنین جهت خطوطی که تصویر مکعب را تشکیل میدهد خواهد بود. با استفاده از GQN، هوش مصنوعی میتواند این تصاویر را بدون دیدن مکعب از زوایای دیگر و سایهها و نورپردازی آن تولید کند.
در حال حاضر محققین این شرکت در حال کار بر روی توسعهی آن و دستیابی به توانایی ادراک صحنهها بدون سرپرستی انسان هستند. این هوش مصنوعی تاکنون با تصاویری از دنیای واقعی مورد آزمایش قرار نگرفتهاست و قدم بعدی ایجاد امکان رندرینگ صحنههای سه بعدی واقعی از تصاویر عکاسی شده خواهد بود.
احتمالاً در آیندهای نزدیک هوش مصنوعی شرکت DeepMind بر پایهی GQN بتواند صحنههای دلخواه سه بعدی نزدیک به واقعیت از زوایای مختلف را تنها با نمایش یک عکس به آن ایجاد کند.