فرارسیدن پایان عمر کپچاهای سنتی
گزینه های بر پایه ی متن با هدف تایید هویت در وب سایت ها و دیگر انجمن های دیجیتال، به زودی جایگزین خواهند شد. بنابراین، خود را برای شناسایی چیزهایی مانند ماشین ها، پارک ها و ویترین فروشگاه ها از شبکه های تصویر کپچا (CAPTCHA)، آماده کنید.
کپچا، مخفف عبارت آزمایش خودکار عمومی برای تشخیص رایانه از انسان1 است. از این ویژگی به منظور تفکیک انسان از بات ها بهره گرفته می شود. با این حال، وجود تعداد زیادی از حساب های کاربری جعلی در بسترهای رسانه های اجتماعی مانند فیسبوک حاکی از آن است که این مکانیزم، عاری از خطا نیست.
اخیرا محققان تحقیقاتی را درباره ی مکانیزم های تشخیص تصاویر و یادگیری ماشینی با عنوان «یک حل کننده ی دیگر متن کپچا: رویکرد مبتنی بر شبکه ی مولد خصمانه2»، انجام دادند. طبق این مطالعه، دانشمندان معتقدند که طراحی پازل های سخت تر برای شناسایی درست نرم افزار و انسان، مهم است. برای اثبات این هدف، الگوریتم جدیدی توسط هوش مصنوعی که بر پایه ی روش های یادگیری عمیق است، گسترش یافت.
سیستم جدید، در حل نقاط ضعف امنیت کپچا و سامانه های تشخیص هویت، بسیار موثر واقع شد. علاوه بر این، می تواند به میزان زیادی از سیستم های متنی کپچا که بیشتر وب سایت ها به منظور حصول اطمینان از حفاظت مطلوب از آن استفاده می کنند، پیشی بگیرد.
الگوریتم یاد شده «Solver» نام داشته، توسط جمعی از دانشمندان رایانه از دانشگاه های «Northwest»، «Lancaster» درانگلستان و «Peking» در چین توسعه یافته است. محققان ادعا می کنند که روش یاد شده، نتیجه ی دقیق تری نسبت به روش متنی ارائه می دهد. این روش به راحتی می تواند آن نسخه های کپچا را که سامانه های حملات قبلی نتوانستند موفق شوند، نقض کند. به علاوه از کارایی بسیاری بالایی بهره می برد. به طوریکه قادر است تا یک تست کپچا را در یک رایانه ی رومیزی و تنها در 0.5 ثانیه انجام دهد.
وقتی صحبت از اهمیت امنیت وب سایت ها می شود، کپچاهای مبتنی بر متن گزینه های قابل اعتمادی نیستند. چنین کدهایی، شامل استفاده مخلوط از حروف الفبا و اعداد و همچنین ویژگی های دیگر مانند خطوطی روی متون برای شناسایی انسان ها و نرم افزارهای خودکار مخرب هستند. ایده اصلی پشت کپچاهای مبتنی بر متن، این است که انسان ها نسبت به ماشین ها، حروف و اعداد را راحت تر تشخیص می دهند.
سولور از روشی به نام «GAN» که به معنی شبکه های مولد خصمانه (Generative Adversarial Network) است، استفاده می کند. این روش شامل آموزش برنامه ی مولد کپچا برای ایجاد تعداد زیادی کپچاهای آموزشی است که از کپچای اصلی قابل تشخیص نیستند. به این ترتیب، با استفاده از کپچاهای خودکار آموخته شده، کاهش زمان و تلاش لازم برای شناسایی و علامت گذاری دستی کپچاها برای آموزش نرم افزار، امکان پذیر می شود.
دکتر ژنگ وانگ (Zheng Wang)، استاد ارشد دانشگاه لنکستر که یکی از نویسندگان تحقیق یاد شده است، ذکر کرد:
این اولین باری است که از روش مبتنی بر GAN برای ساخت حل کننده ها استفاده می شود. پژوهش های ما نشان می دهد که ویژگی های امنیتی که توسط طرح های کپچای کنونی مبتنی بر متن استفاده می شود، به ویژه در روش های یادگیری عمیق، آسیب پذیر هستند. ما برای اولین بار نشان می دهیم که چگونه یک دشمن می تواند به سرعت یک حمله روی طرح جدید کپچا بر پایه ی متن را با کمترین تلاش، راه اندازی کند.
این سیستم تنها به 500 کپچای اصلی نیاز دارد. این میزان معمولا برای آموزش موثر یک برنامه ی حمله، مورد نیاز است.
از آن جایی که روش جدید، کمترین میزان دخالت انسان را می طلبد، بازسازی و هدفگیری طرح های کپچای جدید و اصلاح شده، آسان است. این برنامه، با حدود 33 طرح کپچا، مورد آزمایش قرار گرفت. 11 مورد از این طرح ها، معمولا توسط وب سایت های معروف مانند مایکروسافت، ای بی (eBay) و ویکیپدیا استفاده می شوند.
گوییکسین (Guixin)، نویسنده ی اصلی پژوهش توضیح داد:
با توجه به میزان موفقیت بالای رویکرد ما برای حل بیشتر طرح های کپچا، وب سایت ها باید استفاده از این کدها را متوقف کنند.
محققان همچنین اظهار کردند وب سایت هایی که مدت زیادی است فعالیت دارند، شروع به جستجو برای روش های دیگر احراز هویت کرده اند. آنها روش هایی را به کار می برند که از لایه های مختلف امنیتی مانند اطلاعات بیومتریک یا موقعیت دستگاه، استفاده می کنند. علاوه بر این، محققان معتقدند که وب سایت ها باید اقدامات دیگری را در نظر بگیرند که از لایه های متعدد امنیتی استفاده می کنند؛ نظیر الگوهای استفاده ی کاربر، موقعیت دستگاه یا حتی اطلاعات زیست سنجشی.
- Completely Automated Public Turing test to tell Computers and Humans Apart
- Yet Another Text Captcha Solver: A Generative Adversarial Network Based Approach