مصورسازی بدافزارها توسط مایکروسافت و اینتل
به گزارش کارگروه فناوری اطلاعات سایبربان؛ شرکتهای مایکروسافت و اینتل به تازگی شروع به همکاری روی یک پروژه جدید کردهاند. هدف این همکاری ایجاد رویکردی جدیدی برای شناسایی و طبقهبندی بدافزارها است. این طرح «استامینا» (STAMINA) نام داشته و نمونه بدافزارها را به تصاویری با طیف رندگی مشکی تبدیل میکند. سپس این تصاویر به منظور تشخیص الگوهای ساختاری مخصوص هر بدافزار مورد بررسی قرار میگیرند.
پژوهشگران توضیح دادند تمام فرآیند در چند مرحله بسیار ساده انجام میگیرد. در اولین گام یک فایل ورودی دریافت شده و اطلاعات باینری آن به جریانی از دادههای پیکسلی خام تبدیل میشوند. سپس این تصاویر تکبعدی به نمونههای 2 بعدی تبدیل خواهند شد تا الگوریتمهای تحلیل تصاویر معمولی به توانند آنها را بررسی کنند. عرض تصاویر با توجه به اندازه فایل تعیین میگردد. ارتفاع عکس دو بعدی نیز متغیر بوده، بر اساس تقسیم جریان دادههای تکبعدی با عرض عکس به دست میآید. پژوهشگران پس از تبدیل دادههای تکبعدی به تصاویر 2 بعدی، ابعاد عکس را کوچکتر میکنند.
محققان شرح دادند تغییر اندازه تصاویر خام، تأثیر منفی روی نتایج طبقهبندی نخواهد گذاشت. این یک مسئله ضروری است؛ زیرا منابع محاسباتی دیگر نیازی به کار با تصاویری که از میلیاردها پیکسل تشکیل شدهاند نداشته و سرعت پردازش کند نخواهد شد.
در نهایت یک الگوریتم شبکه عصبی عمیق (DNN) از قبل آموزش دیده به واسطه تصاویر به دست آمده تغذیه میشود تا آنها را به عنوان فایلهای آلوده یا سالم طبقهبندی کند.
مایکروسافت شرح داد از 2.2 میلیون فایل آلوده قابلحمل در تحقیقات یاد شده استفاده شده است. محققان از 60 درصد فایلها که حاوی بدافزارهای شناخته شده بودند برای آموزش هوش مصنوعی بهره گرفتند. به علاوه 20 درصد از فایلها برای اعتبار سنجی و 20 درصد دیگر نیز برای انجام آزمایش واقعی الگوریتم یاد شده استفاده شدند.
پژوهشگران اظهار کردند استامینا در زمان آزمایش دقت 99.07 درصدی برای شناسایی و طبقهبندی بدافزارها از خود نشان داد. همچنین نرخ خدای هشدار کاذب آن تنها 2.58 درصد است.
تحقیقات یاد شده در راستای اقدامات جدید مایکروسافت به منظور شناسایی بدافزارها با استفاده الگوریتمهای یادگیری ماشینی انجام گرفت. محققان این شرح دادند با وجود این که استامینا در هنگام بررسی فایلهای کوچک از دقت و سرعت بالایی برخوردار است. در زمان بررسی فایلهای حجیم دچار خطا میشود؛ زیرا مجبور است میلیارد پیکسل را به یک تصویر با پسوند «JPEG» تبدیل کرده و مجدداً ابعاد آن را تنظیم کند. با وجود این اگر تنها برای بررسی فایلهای کمحجم از این الگوریتم بهره گرفته شود، نتایج بسیار خوبی به دست خواهند آمد.
تانمی گاناچاریا (Tanmay Ganacharya)، مدیر بخش تحقیقات امنیتی حفاظت تهدید مایکروسافت شرح داد، این شرکت هماکنون برای شناسایی تهدیدها به شدت الگوریتمهای یادگیری ماشینی وابسته است. این فناوری از ماژولهای مختلف یادگیری ماشینی بهره گرفته، روی سیستم مشتری یا سرورهای مایکروسافت قرار میگیرد. همچنین با توجه به نتایج گزارشهای، استامینا ممکن است در آینده به یکی از ماژولهای مورد استفاده این بستر تبدیل شود.