چگونه هوش مصنوعی صنعت عکاسی را تغییر میدهد؟
به گزارش کارگروه فناوری اطلاعات سایبربان یکی از دستاوردهای بزرگ در این زمینه، در برنامه Google Photos دیده شد، اپلیکیشنی که در سال 2015 معرفی شد و ترکیب نوین و جذابی از تکنولوژی هوش مصنوعی و صنعت عکاسی محسوب میشود. تا قبل از معرفی این برنامه، این شرکت برای مدیریت تصاویر در قسمت Google+، از تکنولوژی یادگیری ماشینی (machine learning) استفاده میکرد اما با معرفی برنامه Photos، قابلیتهای جدیدی مانند تشخیص هوشمند چهره معرفی شد که به نوبه خود بسیار منحصر به فرد بود. این قابلیت میتوانست چهره افراد داخل عکس را شناسایی کند و تمامی عکسها را بر این اساس منظم و مرتب کند.
در سال 2013، گوگل شرکت DNNresearch را خریداری کرد و بعد از آن مجموعهای از شبکههای عصبی را توسعه داد که دادههای آن، توسط تیمی انسانی مدیریت و نظارت میشدند. این پروسه، یادگیری نظارت شده نام گرفت، پروسهای که در آن برای دسته بندی تصاویر، از سرنخهای تصویری داخل میلیونها عکس استفاده میشد. این الگوریتم در طول زمان در زمینه تشخیص، پیشرفت زیادی کرد. با آموزشهای حرفهایتر، جستجوی عبارات انتزاعیتر مثلا «حیوان» یا «صبحانه» امکان پذیر شد، عباراتی که شاید در نگاه اول سرنخ های تصویری در آنها موجود نباشد.
برای آموزش الگوریتمهای تحلیلی پیشرفته، زمان و قدرت پردازشی زیادی صرف شد و حالا تمامی کارها توسط دیتا سنترهای قدرتمند انجام شده و این تکنولوژی حتی روی موبایلهای نه چندان حرفهای هم به خوبی کار میکند. بیشتر کارها بعد از اپلود عکسها به روی فضای ابری انجام میگیرد، و بعد از آن گوگل با استفاده از مدلهای تحلیلی خود، تمامی گالری عکسهای شما را مرتب و منظم می کند.
یک سال بعد از اینکه Google Photos معرفی شد، شرکت اپل نیز قابلیت مشابهی را معرفی کرد اما به دلایل مربوط به حریم شخصی، این پردازش توسط پردازندههای گوشی شخص انجام میگیرد و هیچ گونه دادهای به هیچ جا ارسال نمیشود. به همین دلیل، این کار به روی گوشیهای اپل ممکن است روزها زمان ببرد.
نرم افزار مدیریت هوشمند عکسها توسعههای زیادی داشته اما تکنولوژیهای هوش مصنوعی و یادگیری ماشینی تاثیرات به مراتب بزرگ تری در دنیای عکاسی داشته اند. لنزها، پر سرعتتر شده و سنسورهای پیشرفتهتر و به مراتب بزرگتری به روی آنها تعبیه شده است. البته با پیشرفت در این حوزه، مسیر تکنولوژی به سمت کوچکتر شدن فیزیکی تراشهها و قطعات حرکت کرده و حالا شاهدیم که در بسیاری از شرایط، دوربین گوشیهای موبایل خیلی بهتر از دوربینهای حرفه ای عکاسی، تصاویر را ثبت میکنند.
تراشههای کوچک سوار شده به روی گوشیهای موبایل، قدرت پردازشی بالاتر و حرفهایتری دارند و به همین دلیل سیستم اکثر دوربینهای حرفه ای عکاسی، قدرت رقابت با آنها را ندارند.
سخت افزارهای کنونی در این حوزه در واقع تحت عنوان سخت افزارهای مخصوص «عکاسی محاسبهای» شناخته میشوند. این عنوان طیف وسیعی از از قابلیتها و امکانات دوربینهای عکاسی موبایل را پوشش میدهد از جمله افکت depth-of-field effects که در حالت پرتره استفاده میشود، یا الگوریتمهایی که در ذخیرهسازی تصاویر با کیفیت Google Pixel کمک میکنند. البته تمام قسمتهای عکاسی محاسبهای، از هوش مصنوعی استفاده نمی شود اما این تکنولوژی بدون شک یکی از اصلیترین قسمتهای این حوزه است.
اپل هم از این تکنولوژی استفاده کرده و برای قسمت «حالت پرتره» که مخصوص آیفونهای دو دوربینه است، استفاده میکند. پردازنده سیگنالی تصویر در آیفون با استفاده از تکنیکهای یادگیری ماشینی قادر است افراد را با یک دوربین شناسایی کرده و با دوربین دوم، یک نقشه عمق دار ساخته میشود که برای شناسایی اجسام و یا مات کردن پشت صحنه استفاده میشود.
گوگل در زمینه استفاده هوش مصنوعی در عکاسی، همچنان سردمدار است با تولید سه نسل از گوشی Pixel این برتری را اثبات کرده است. گوگل سیستمهای هوش مصنوعی خود را به گونهای منحصر به فرد تمرین میدهد و با کمک مراکز دادههای عظیمی که دارد، عکسها را لیبل گذاری کرده- کاری که دقیقا سیستم نرم افزاری Google Photos انجام میدهد-که این کار در عکس برداری های بعدی دوربین دستگاه تاثیر گذار خواهد بود. به عنوان مثال گوشی Pixel 2 تصاویر فوق العاده با کیفیت و حرفه ای ثبت میکند.
چند ماه پیش، گوگل قابلیتی برای گوشی پیکسل جدید معرفی کرد تحت عنوان Night Sight که در آن با استفاده از الگوریتمهای یادگیری ماشینی، محاسبات دقیقتری از وضعیت رنگها و نور تصویر انجام میگیرد. نتیجهای که عکاسی با این قابلیت در پی دارد، خیره کننده است. این قابلیت بهترین اثر را در گوشیهای پیکسل 3 دارد زیرا این الگوریتم برای جدیدترین سخت افزار طراحی شده است، البته گوگل این قابلیت را برای دیگر گوشیهای پیکسل نیز ارائه کرده است.
این شرکت ثابت کرده که این نرم افزارها هستند که همیشه بیشترین تغییر را ایجاد میکنند به خصوص اگر با تکنولوژی هوش مصنوعی مرتبط باشند. گوشی جدید Honor، که View 20 نام دارد، همراه با Huawei’s Nova 4, اولین گوشیهایی هستند که از سنسورهای تصویری Sony IMX586 بهره بردهاند. این سنسور کمی از رقبای دیگر خود بزرگتر است و با 48 مگاپیکسل، بیشترین رزولوشونی را ارائه میدهد که تا کنون برای یک گوشی موبایل در نظر گرفته شده است. اما موضوع کوچک بودن فضا برای این سنسور، کمی مشکل ساز شده است و همین مسئله به روی کیفیت تصویر بی تاثیر نبوده است. در آزمایشهای Sony IMX586 شرکت Honorاز قابلیت هوش مصنوعی AI Ultra Clarity استفاده کرده که برای ارائه حداکثری رزولوشن تصویر کاربرد دارد. این قابلیت نیز نتیجه بسیار چشم گیری در کیفیت عکسهای ثبت شده با دوربین این گوشی داشته است.
پردازندههای سیگنال تصویر هم تا مدتها برای عملکرد بهتر دوربین گوشیها، مهم بودهاند اما حالا به نظر میرسد که NPU یا پردازندههای هستهای با پیشرفت عکاسی محاسبهای، بیشتر از بقیه تاثیر گذارهستند. هواوی اولین شرکتی بود که سیستم داخل چیپ مجهز به هوش مصنوعی که Kirin 970 نام دارد را معرفی کرد. شرکت اپل هم تراشه اختصاصی A11 Bionic خود را خیلی زودتر از دیگر رقبا به مشتریان عرضه کرد.
کوالکام، بزرگترین تامین کنند پردازندههای اندرویدی در سرتاسر دنیا، فعلا هیچ محصول مرتبط با تکنولوژی یادگیری ماشینی عرضه نکرده اما گوگل نیز تراشه اختصاصی خود را با نام Pixel Visual Core معرفی کرد که برای انجام امور مرتبط با هوش مصنوعی کارامد است.
تراشه جدید A12 Bionic اپل مجهز به یک موتور 8 هستهای است و مخصوصی سیستم Core ML اپل طراحی شده-Core ML یک فریمورک مجهز به یادگیری ماشینی است که مختص اپل است. سرعت تراشه جدید اپل 9 برابر بیشتر از A11 است و برای اولین بار مستقیما به پردازنده تصویر متصل است. اپل میگوید که این تکنولوژی به دوربین دستگاه این امکان را میدهد تا عمق واقع گرایانهتری در تصاویر ثبت شود.
طی چند سال اخیر، از بین تمام اپلیکیشنها و امکاناتی به لطف تکنولوژی هوش مصنوعی تولید شده، حیطهای که بیشترین تاثیر را از این تکنولوژی گرفته بی شک عکاسی است. دوربینها حالا یکی از اجزای اصلی گوشیهای هوشمند محسوب میشوند و هوش مصنوعی نیز در این بین کمک میکند که این دوربینها روز به روز حرفهایتر و بهتر شوند.