استخراج اطلاعات از صدای مردم
مقدمه:
از زمان به وجود آمدن تلفنهای هوشمند، استفاده از این ابزار به صورت روزافزون در حال افزایش است و در هر گوشهای میتوان آنها را مشاهده کرد.
بسیاری از مردم هماکنون نسبت به چالشهای حریم خصوصی به وجود آمده به واسطهی تلفنهای هوشمند آگاه هستند. برای مثال میتوان به شناسایی حرکات و تصویربرداری بدون اجازه توسط این ابزارها اشاره کرد. همچنین از مدتی قبل تعداد افرادی که نسبت به شنود مکالمات از طریق این فناوری ابراز نگرانی میکنند، رو به افزایش است.
چه اطلاعاتی را میتوان از صدا استراج کرد؟
ممکن است اکنون شواهد بسیاری در رابطه با شنود صدای افراد وجود نداشته باشد؛ اما این مسئله دور از انتظار نیست. محققان سراسر جهان از مدتها قبل شروع به توسعه انواع الگوریتمهای قدرتمند هوش مصنوعی کردهاند که میتوانند صدا را تجزیهوتحلیل کرده و اطلاعات با ارزشی را تنها از طریق صدای اهداف به دست آورند. در حالی که این فناوری تنها در مراحل اولیهی ظهور خود در جهان واقعی قرار دارد، قابلیتهای آن به سرعت در حال رشد بوده و میتوانند به صورت تماموقت به فعالیت ادامه دهند. همین مسئله تأثیر بسزایی را روی حریم خصوصی افراد خواهد گذاشت.
بیشتر هوشهای مصنوعی امروزی بهگونهای توسعه داده میشوند تا به جای تجزیهوتحلیل کلمه به کلمهای که مردم در مکالمه به یکدیگر میگویند، اطلاعات ارزشمندی را تنها از طریق صدای افراد به دست آورند.
برای مثال به کمک صدای افراد میتوان نام، نام خانوادگی، ملیت، محل سکونت، جنسیت، سن و زبان گفتاری مخاطب را شناسایی کرد. همچنین در نمونهای دیگر امکان تشخیص حقیقت داشتن یا دروغ بودن گفتههای هدف، سلامتی و میزان تناسباندام، حالت احساسی یا مست بودن یا نبودن مشخص میشود.
به علاوه مدتی قبل سامانهای توسعه داده شد که تنها از طریق صدای افرادی که با دهن پر صحبت میکنند، نوع مادهی غذایی که در حال خوردن آن هستند، تشخیص داد. به علاوه از طریق صدا میتوان بیماری افراد را مشخص کرد.
سامانههای هوش مصنوعی همچنین میتوانند از روی صدای موجود در پسزمینه، حوادثی مانند تیراندازی یا تصادف ماشین را تشخیص دهند. از طرفی در نمونهای دیگر، نگرش سخنرانها را از روی متن بیان شده متوجه شده و حتی پیامهای پنهان و اختلافات میان سخنگوها را استخراج میکند.
در سال گذشته نیز نوعی هوش مصنوعی توسعه داده شد که قادر بود با توجه به تن صدای 2 نفر در زمان گفتگو با یکدیگر، پیشبینی کند که آیا آنها به ارتباط با یکدیگر ادامه خواهند داد یا خیر.
فعالیت شبانه روزی یادگیری ماشینی
همهی مثالهای یاد شده، بدون توجه به این که قصد استخراج چه اطلاعاتی دارند، از یادگیری ماشینی استفاده میکنند. برای آموزش این الگوریتم حجم عظیمی از دادههای برچسبگذاری شده موردنیاز است. با پردازش هزاران یا میلیونها نمونهی مختلف، هوش مصنوعی به مرور زمان شروع به مطابقت دادن اطلاعات ورودی با دادههای برچسبگذاری شده میکند.
برای مثال در سیستمی که برای شناسایی جنسیت افراد به کار گرفته میشود، ابتدا صدای افراد را از طریق تلفن هوشمند آنها ذخیره و با پردازش آن ویژگیهای گوناگونی را استخراج میکند. به طور معمول در بازههای زمانی 20 میلیثانیه، از دامنه و فرکانس گفتگوی در حال انجام نمونهبرداری میشود. فرکانس گفتاری زن و مرد در طول انجام یک مکالمه تا حدی با هم متفاوت است؛ در نتیجه با بررسی نمونههای یاد شده میتوان جنسیت را تشخیص داد.
سامانههای یادگیری ماشینی تنها به نمونههای برداشته شده توجه نمیکند؛ بلکه تعداد آنها، حالت کلی و نحوهی تغییر در طول زمان را نیز مدنظر قرار میدهد. در حالی که ضبط صدا روی خود تلفن هوشمند اتفاق میافتد، نمونهای از آن از طریق اینترنت به سرورهایی ارسال میگردد تا ویژگیهای موجود در آن را استخراج، آمارشان را محاسبه و بخش یادگیری ماشینی را مدیریت کند.
هوش مصنوعی در ابتدا به منظور انجام کارهای مفهومی که به طور معمول نیاز به هوش انسانی دارند، ایجاد شد. با وجود این در حال حاضر بسیاری از این سامانهها وظایف ادراکی و مفهومی را انجام داده و اطلاعات آن را در اختیار انسان قرار میدهند که نشان میدهد هنوز نمیتوانند عملکردی مستقل داشته باشند.
برای مثال یک سامانهی هوش مصنوعی صوتی برای نظارت جادهای میتواند با توجه به صدای یک تصادف، به کنترلکنندگان ترافیک هشدار دهد. یا در مثالی دیگر پزشکی را با توجه به شرایط بحرانی موجود با خبر کند؛ اما این انسانها هستند که همچنان در مرکز حلقهی تصمیمگیری قرار داشته و با توجه به اطلاعات ارائه شده، اقدام نهایی را انجام میدهند.
با وجود این نسل جدید سامانههای هوش مصنوعی در حال تغییر هستند. توانایی بسیاری از این سامانهها در حال پیش گرفتن از انسان بوده و حتی بدون مداخلهی انسان همهی کارها را انجام میدهند.
شرکتهای آمازون و گوگل ادعا میکنند بلندگوهای هوشمند آنها با نامهای ایکو (Echo) و هوم (Home) توانایی فکر کردند دارند. این نوع از هوشهای مصنوعی میتوانند مستقیماً به فرمانهای داده شده از صوت کاربر واکنش نشان داده و بر اساس آن عمل کنند. برای مثال میتوان از الکسا (Alexa)، دستیار صوتی آمازون درخواست که چراغهای خانه را روشن یا پردهی هوشمند را کنار بزند.
سیستمهای نظارتی ویدئویی یا صوتی هماکنون نیز قابلیت ردیابی اقدامات مردم را دارند؛ اما هوشهای مصنوعی مدنظر در بالا قادر خواهند بود هدف پشت یک رفتار و چیزی که به آن فکر میشود را دارد، حتی در صورتی که به زبان آورده نشود. بسیاری از ارائهدهندگان این گونه خدمات ادعا میکنند صدای افراد شناسایی و ذخیره نمیشود؛ مگر اینکه فرمانی توسط آنها صادر شود؛ اما گزارشهایی وجود دارند که خلاف این مسئله را نشان میدهد. برای مثال تنها در یک مورد بیان شد که الکسا مکالمات خصوصی میان افراد را ضبط کرده، آنها در اختیار دیگر کاربران قرار میدهد.
به علاوه پژوهشگران اثبات کردهاند که تبدیل یک تلفن هوشمند به ابزاری دائمی برای شنود کار پیچیدهای نیست. مدت زمان زیادی طول نخواهد کشید که یک تبلیغکننده یا کلاهبردار با استفاده از فناوری یادش شده، نوع افکار اهداف خود را درک کرده و ضعفها خصوصی آنها را هدف قرار دهند.
نتیجه گیری:
سازمانهایی مانند انجمن حریم خصوصی جهان (World Privacy Forum)، مبارزه برای آینده (Fight for the Future) و بنیاد مرز الکترونیک (Electronic Frontier Foundation)، به منظور حصول اطمینان از این که حقوق حریم خصوصی مردم در برابر سیستمهای سنجش دیجیتال یا نظارت تبلیغاتی حفظ میشود، مشغول فعالیت هستند.
زمانی که فردی یک برنامه یا بازی را روی تلفن هوشمند خود نصب میکند و این نرمافزار اجازهی دسترسی به همهی حسگرها را طلب میکند؛ بهتر است به یاد داشته باشد که موارد موافقت شده با آن چه ظرفیتهایی دارند. این حسگرها بهواسطهی دادههایی که جمعآوری میکنند، مخاطب و دوست وی را بسیار بهتر از خودشان خواهد شناخت؛ زیرا در همهجا همراه آنها است و به تمام صداهای تولید شده توسط فرد گوش میدهد.
اما آیا همانگونه که میتوانیم به دوستان یا خانوادهی خود اعتماد کنیم، قادر هستیم به شرکتها یا افرادی که دادههای ما را جمعآوری میکنند نیز اطمینان کنیم یا خیر؟