شناسایی محتوای جعلی با سمافور
به گزارش کارگروه فناوری اطلاعات سایبربان؛ تهدیدات دستکاری رسانههای چندحالتی شامل صوت، تصویر، ویدئو و متن، به واسطه افزایش دسترسی فناوریهای دستکاری خودکار به صورت روزافزون در حال افزایش است. به علاوه رسانههای اجتماعی بستری بسیار مناسب برای به اشتراکگذاری این گونه محتوای آلوده است.
سازندگان ویدئوها و محتوای دروغین، دیگر اشخاص یا گروههایی با منابع و مهارت قابلتوجه نیستد؛ بلکه هر فردی قادر است محتوایی را دریافت کرده و به شکل باورپذیری آن را جعل کند.
مات تورک (Matt Turek)، مدیر برنامه دفتر نوآوری اطلاعات دارپا گفت:
در نقطه اشتراک دستکاری بسترها و رسانههای اجتماعی، تهدید اطلاعات جعلی طراحی شده و تأثیر منفی آن روی بازدیدکنندگان و ایجاد ناآرامی وجود دارد. در حالی که این مسئله ترسناک به نظر میرسد؛ اما در واقع همهی دستکاریهای صورت گرفته روی رسانهها در جهان واقعی تأثیر یکسانی ندارند.
تورک ادامه داد:
صنعت سینما سالها است که از روشهای ویرایش پیشرفته استفاده میکند تا محتوایی سرگرم به وجود آورد. در مقابل از رسانههای دستکاری شده نیز به منظور هدف قرار دادن شهرت، سیاست و جنبههای کلیدی دیگری جامعه بهره گرفته میشود. مشخص کردن نحوه ایجاد یا تغییر محتوای رسانهای، واکنش صورت گرفته برای دستیابی به آن و شناسایی فرد مسئول، به بررسی سریعتر این موضوع که آیا محتوا، یک تهدید جدی است یا خیر، کمک میکند.
با وجود این که روشهای آماری امروزی تا حدی در شناسایی محتوای دستکاری شده موفق بودند؛ اما شیوههای صرفاً آماری توانایی رقابت با پیشرفت سریع راهکارهای دستکاری رسانه را ندارند. البته قابلیت دستکاری خودکار، برای ایجاد محتوای جعلی در بیشتر موارد به رویکردهای داده محور وابسته هستند که به هزاران نمونهی مختلف برای آموزش نیاز دارند. این شیوه احتمال انجام خطای معنایی را دارد. همین شکستها فرصتی را به نیروهای امنیتی میدهد تا بتوانند آن را شناسایی کنند.
سازمان دارپا به منظور رفع چالش مذکور پروژه سیمنتیک فورنسیک یا سمافور (SemaFor) را راهاندازی کرد تا فناوریهایی را برای تشخیص خودکار، نسبت دادن و توصیف خصوصیاتهای رسانههای جعلی، به وجود آورد. هدف از این کار ایجاد مجموعهای از الگوریتمهای تجزیهوتحلیل معنایی است تا فشار را روی سازندگان محتوای جعلی افزایش داده، توسعه چنین محتوایی را با چالش مواجه کند. این الگوریتمها توانایی شناسایی، درک و جلوگیری از محتوای جعلی را دارند. این الگوریتمها به سه دسته شناسایی، انتساب و توصیف تقسیم میشوند.
الگوریتمهای شناسایی مشخص میکنند که آیا یک محتوا دستکاری شده است یا خیر. الگوریتمهای انتساب فرد یا سازمان مرتبط و انتشار دهنده ویدئو چندحالته را پیدا میکند. این الگوریتم نحوه ایجاد رسانه، انگیزه مهاجم و مهارتهای موردنیاز برای توسعه محتوای تحت بررسی را مشخص میکند. در نهایت الگوریتم توصیف مشخص میکنند که آیا این محتوا با هدف تخریب و دستکاری استدلال تولید شده است یا خیر. سمافور همچنین ابزارهایی را در اختیار تحلیلگران انسانی قرار میدهند که بتوانند به صورت کارآمدتری ویدئوی دستکاری شده را بررسی و اولویتبندی کنند.
تورک افزود:
بین محتوایی که با هدف سرگرمی دستکاری میشوند و نمونههایی که به منظور تخریب و ایجاد تأثیرات منفی به وجود میآیند، تفاوت وجود دارد. الگوریتمهای مذکور در پروژه سمافور به تفکیک این 2 کمک کرده و محتوای مخرب را به صورت خودکار تشخیص میدهد.