اجلاس Google I/O 2018، هوشمندتر شدن گوگل لنز
به گزارش کارگروه فناوری اطلاعات سایبربان، به نقل از «techcrunch»؛ گوگل در زمان برگزاری اجلاس سالانه ی خود شیوه جدیدی از ترکیب دوربین تلفن های هوشمند و هوش مصنوعی را به نمایش گذاشت.
گوگل نشان داد با استفاده از دوربین تلفن هوشمند و گوگل مپز (Google maps)، روش ناوبری بهتری برای پیدا کردن مسیر در شهرها ایجاد می شود. این شرکت همچنین ویژگی های جدیدی را برای گوگل لنز (Google Lens) معرفی کرد.
لنز را می توان نوعی موتور جستجوگر تصویری به حساب آورد که با نگاه داشتن دوربین، اطلاعات همه ی اشیا موجود در آن را به کاربر نمایش می دهد. این فناوری سال گذشته معرفی و با برنامه ی فوتوز و مترجم شرکت مذکور یکپارچه شده بود و هم اینک در نرم افزار مپز نیز به کار گرفته شده است.
گوگل مپز برای دستیابی به هدف بالا با دوربین، فناوری دید رایانه ای و استریت ویو (Street View) ترکیب شده است. این ویژگی باعث می شود مردم خود را در محیط استریت ویو حس کنند. در این حالت رابط کاربری مپز به پایین صفحه منتقل می شود و دوربین محیط جلوی کاربر را به وی نشان می دهد. از طرفی روباهی نیز در میان تصویر ظاهر خواهد شد که مسیر را به وی نشان می دهد.
گوگل لنز تا کنون امکان شناسایی ساختمان ها، تبلیغات موجود در محیط، نوع گیاه و بسیاری موارد دیگر را فراهم می کرد؛ اما هم اینک قابلیت های جدیدی را دریافت کرده است. لنز از این پس می تواند متن های موجود در تصویر را شناسایی کند. برای مثال می توان از آن برای خواندن متن علامت های ترافیکی، اعلامیه ها یا کارت های تجاری استفاده کرد.
لنز نه تنها قابیلت خواندن متن ها را دارد، بلکه می تواند مفهوم و محتوای اصلی آن را نیز تشخیص بدهد. برای مثال کاربر می تواند کد روی کارت های اعتباری یا رمز عبور وای فای را به کمک این برنامه مستقیما به ابزار خود وارد کند. البته این ویژگی سال گذشته نیز به نمایش گذاشته شد و هم اینک در دسترس قرار گرفته است.
یکی دیگر از ویژگی های معرفی شده «استایل مچ» (Style Match) نام دارد. به کمک این خصیصه کاربر می تواند روی اشیا موجود در کادر مانند لباس دوربین کلیک کرده، نمونه های مشابه آن را مشاهده کند.
در نهایت باید ذکر کرد لنز از این پس می تواند به صورت زمان واقعی محتوای موجود در دوربین را شناسایی کرده و با تمرکز روی مواردی خاص، اطلاعات آن را ارائه یم دهد.
مقامات گوگل توضیح می دهند از آنجایی که الگوریتم یادگیری ماشینی لنز از خدمات ابری واحد پردازش تنسور (TPU) استفاده می کند، قادر است میلیون ها محل، کلمه و شی را در یک ثانیه پردازش کند.
موارد یاد شده در آینده ای نزدیک در دسترس عموم قرار می گیرند.