راه پیروزی در رقابت ماشین یادگیری؛ برتری در حوزهی داده
به گزارش کارگروه فناوری اطلاعات سایبربان؛ یادگیری ماشین اصطلاحی است که عموما با هوش مصنوعی نیز اشتباه گرفته میشود. این فناوری درحالتبدیل به دارایی باارزشی برای شرکتها است. بهعلاوه، شرکتهای فعال در حوزهی طراحی و بهینهسازی یادگیری ماشین، بهنوعی متوجه مشکلات اصلی آن شدهاند. آنها میدانند اجرای الگوریتمها برای هوشمندشدن در ارتباط با مرکز داده یا مسئلهای مشخص، بخش آسان کار محسوب میشود.
راهکارهای متعدد و آسان شرکتهای بزرگ برای اجرای سیستمهای یادگیری ماشین عرضه شدهاند. بهعنوان مثال،گوگل با الگوریتم متنباز تِنسورفِلو (TensorFlow) و مایکروسافت با ارائهی خدمات یادگیری ماشین درآژور (Azure) و آمازون با سرویس سِیجمِیکر (SageMaker)، قابلیتهای مذکور را به کاربران عرضه میکنند.
داده، ورودی باارزش سیستمهای یادگیری ماشین و هوش مصنوعی، تنها بخشی است که تجاری نشده است. باوجوداین، دادهها بهعنوان بازیگران مهم و تأثیرگذار در رقابت یادگیری ماشین شناخته میشوند. درواقع، پیداکردن دادهی باارزش دشواریهای زیادی دارد.
دادهی باارزش و مفید و کمیاب
شرکتها برای انجام پروژههای هوش مصنوعی و یادگیری ماشین، دادهی لازمشان را دراختیار ندارند. بههمیندلیل، داده درحالتبدیل به بازیگری تأثیرگذار در صنعت است. در دهههای گذشته، شرکتها فعالیت و موفقیت خود را برپایهی داراییهای فیزیکی و مالی، یعنی پول و اجناس تثبیت کردهاند. حتی در سال ۲۰۱۳ یک جایزهی نوبل برای طرحی در زمینهی قیمتگذاری روی داراییها درنظر گرفته شد. چنین جایزهها و رویدادهایی اولویت پرداختن به موضوعات ذکرشده را بیشازپیش کرد.
شرکتهای موفق دنیای امروز با داراییها و محصولات فیزیکی تجارت نمیکنند. بهبیاندیگر، اغلب دارایی باارزش آنها محصولاتی تحتشبکه یا نرمافزار هستند. در چهل سال گذشته، تمرکز داراییها بهطور کامل تغییر کرده است. در سال ۱۹۷۵، حدود ۸۳درصد از دارایی شرکتها اندازهگیریکردنی بود و در سال ۲۰۱۵، ۸۴درصد از داراییها اندازهگیریکردنی نبود.
داراییهای امروزی شرکتها دیگر اندازهگیریکردنی نیست
اکثر شرکتهای بزرگ امروزی بهجای ساخت محصولات فیزیکی مانند ماشین لباسشویی یا قهوهساز، اپلیکیشن منتشر یا به اتصال هرچه راحتتر مردم کمک میکنند. چنین تغییراتی نوعی ناهماهنگی بین آنچه اندازهگیریکردنی است و آنچه ارزش دارد، ایجاد کرده است.
نتیجهی تغییر در ارزش واقعی شرکتها و محصولات آنها، کمبود دادهی باارزش در سطوح مشکلساز است. بهبیاندیگر، فاصلهی بین ارزشهای بازار و محاسبات مسئولان مالی دنیای کسبوکار روزبهروز بیشتر میشود. بهدلیل همین فاصلهها، شرکتها بیشتر تلاش میکنند تا از فناوری یادگیری ماشین در تصمیمهای مهمشان استفاده کنند.
برخی شرکتها حتی ارزشمندترین مشاوران خود را نیز با هدف اجرای یادگیری ماشین اخراج کردند؛ اما اکثرا به این نتیجه رسیدند که دادهی لازم آنها برای استفاده در سیستمهای هوش مصنوعی، هنوز وجود خارجی ندارد. بهعبارتدیگر، سیستمهای کنونی و فناوریها و روشهای جدید را روی همان مواداولیهی قدیمی و دادههای ضعیف پیاده میکنند.
سیستم یادگیری ماشین نیز تاحدودی مانند انسان عمل میکند؛ یعنی تا وقتی به آن آموزش ندهیم، هوشمند نخواهد شد. بهعلاوه، ماشینها برای هوشمندشدن بسیار بیشتر از انسان به داده نیاز دارند. البته، آنها قطعا این دادهها را با سرعت بسیار بیشتری درمقایسهبا انسانها میخوانند. بنابراین، با وجود رقابت شرکتها در جذب متخصصان هوش مصنوعی و اجرای برنامههای مرتبط، جنگی در پشت صحنه جریان دارد که هدف اصلی آن، دستیابی به دادههای جدید و متفاوت است.
بهعنوان مثالی از دادهی متفاوت و کاربردی در دنیای جدید، میتوان حوزهی مالی و اقتصادی را نام برد. در این حوزه، دیگر گزارشهای رسمی سازمانهای مالی خصوصی و دولتی یا آمارهای سرمایهگذاران باتجربه در تصمیمگیریهای سرمایهگذاری مفید نیستند.
دادههای جایگزین همچون حس موجود در رسانههای اجتماعی و تعداد پتنتهای ثبتشده، از دو زاویه باارزش محسوب میشوند: ۱. دادههای سنّتی روی داراییهای سنّتی متمرکز هستند که در دنیای داراییهای اندازهگیرینشدنی آنچنان ارزشمند نیستند؛ ۲. فایدهای در استفاده از یادگیری ماشین برای تحلیل دادههایی وجود ندارد که همه از آن استفاده میکنند.
بهبیانساده، جستوجو برای مزیت رقابتی در همان مواداولیهای که دیگر رقبا استفاده میکنند، سودی برای شرکتها نخواهد داشت. شرکتهای بزرگ بهجای اجرای استراتژیهای قدیمی، بهدنبال دادههای جدید و یافتن ارتباط و مزیت در آنها هستند. این سازمانها برای پیشبرد اهداف خود حتی دیتاستهای اختصاصی تولید میکنند.
به چه اطلاعاتی نیاز دارید؟
تولید داده دشوارتر از جمعآوری و هماهنگکردن و افزودن آن به مرکز داده خواهد بود. اکثر شرکتها تصور میکنند مسیر صحیح شامل جمعآوری همهی دادههای دردسترس و جستوجو و تحلیل آنها به امید یافتن راهکاری تازه است. درواقع، آنها بهدنبال نتیجه یا پیشبینی هستند که نتیجهی دلخواهشان را نشان دهد.
هوش مصنوعی و یادگیری ماشین توانایی ارائهی نتایج و تحلیلهایی دارد که شاید از عهدهی هیچ فردی برنیاید؛ اما این فناوری نمیتواند نتایج را با ثبات کامل ارائه کند. این نتیجهگیری بهمعنای شکست فناوری مذکور نیست؛ بلکه تنها باید آن را با هوشمندی بهکار گرفت. البته، اجرای آن بسیار دشوارتر از مباحث تئوری است. بهعنوان مثال، بسیاری از مدعیان ارائهی دادههای جدید و متفاوت هنوز از اندازهگیری معیارهای سنّتی برای جمعآوری داده استفاده میکنند.
قدمی که اکثر شرکتها در اجرای سیستم هوش مصنوعی و تولید داده نادیده میگیرند، تعیین اولویت است. یادگیری ماشین در اخذ بینش انسانها و توسعهی روشی سریعتر و درککردنیتر و مقیاسپذیرتر برای اجرای آن بینش مهارت دارد. انسانها نیز بینش و دیدگاه خود را با استفاده از روشهای مختلف از تخمین تجربی گرفته تا تحلیل ارتباط شرکتها بهدست میآورند.
برای بهرهبرداری از برتری یادگیری ماشین در حوزههای مذکور، نباید آن را با هر اطلاعات موجود و تقریبا مرتبطبا حوزهی فعالیت تغذیه کرد؛ بلکه دانشی منظم و ساختاریافته را به آن باید عرضه کرد. پس از ارائهی دادهی مناسب، میتوان امیدوار بود که هوش مصنوعی آن را بیاموزد و شاید مرزهایی از دانش کنونی انسان را فراتر ببرد.
برای شرکتهایی که قصد دارند کاربردی تأثیرگذار از هوش مصنوعی و یادگیری ماشین را در روند کاری خود اجرا کنند، سه اصل وجود دارد.
اصل اول در اجرای سیستم یادگیری ماشین کاربردی، جمعآوری یا تولید دادهی متفاوت است. شما با کارکردن با دادههای دردسترس رقبا، به یافتهی جدیدی دست نخواهید یافت. پیش از شروع، نگاهی به داخل سازمان خود بیندازید. باید آنچه شما و اعضای گروهتان بهطور اختصاصی میدانید، بهعنوان پایههای دیتاست هوش مصنوعی استفاده شود.
اجرای یادگیری ماشین به نقاط دادهی زیادی نیاز دارد؛ اما به آن معنی نیست که مدل شما گسترهی وسیعی از اطلاعات را باید پوشش دهد. بهعبارتدیگر، پس از تغییر زمینهی مطالعهی داده، تمرکز فعالیت خود را مشخص کنید و به آن پایبند باشید.
در اصل دوم، باید ارزش دادهی معنادار درمقایسهبا دادهی جامع را درک کنید. شاید شما در روند جمعآوری داده اطلاعاتی قوی و جزئی فراهم کنید؛ اما حوزهی آن اطلاعات هیچ کاربردی برای سازمان نداشته باشد. در تعریف ساده، اگر شرکت از چنین دادههایی در فرایندهای تصمیمگیری گذشته استفاده نکرده، آنها فایدهای برای سیستم یادگیری ماشین هم نخواهند داشت.
متخصص حرفهای حوزهی یادگیری ماشین پیش از معماری سیستم، از مدیران شرکت سؤالهایی دشوار دربارهی زمینههای مهم میکند. بهعلاوه، او باید بداند زمینههای مهم چگونه در بهکارگیری نتایج استخراجشده از هوش مصنوعی استفاده میشوند. اگر پاسخ به سؤالهای متخصص برای شرکتتان دشوار باشد، درنتیجه هنوز تفکر لازم دربارهی ایجاد ارزش کاربردی از این حوزه را بهکار نگرفتهاید.
اصل سوم بهکارگیری یادگیری ماشین به این نکته تأکید میکند که از دانش خود برای شروع کار استفاده کنید. شرکتهای موفق در اجرای سیستمهای یادگیری ماشین فرایند را با بینش اختصاصی خود دربارهی اولویت اصلی کاری در تصمیمگیریها شروع میکنند. شروع از این مرحله به آنها در انتخاب دادهها برای جمعآوری و فناوریهای لازم کمک میکند.
نقطهی مناسب برای شروع فرایند یادگیری ماشین، مقیاسدهی و رشد دانشی است که درحالحاضر، در تیم وجود دارد. رشد آن دانش در مسیر تولید ارزش برای شرکت مفید خواهد بود.
نکتهی کاملا واضح آن است که نرمافزار جهان را خورده است. این اصطلاح را مارک اندرسن، کارآفرین حوزهی نرمافزار، بیان کرده است. البته، پدیدهی جوان دنیای فناوری هنوز سیر نیست و به رژیمی بهتر متشکل از دادههای جدید و فناوریهای نوین نیاز دارد. با چنین رژیم جدیدی میتوان هنوز با نرمافزار ارزش خلق کرد.
شرکتها و مدیرهای آنها نمیخواهند از تغییر درحالجریان در تفکرها و ماشینها و دادههای جدید عقب بمانند. برای این منظور آنها باید نگاهی به درون خود بیندازند و دادههای باارزش با زوایای دید متفاوت را کشف کنند. تنها با چنین مواداولیهای میتوان نتایج بهتری کسب کرد و شرکت را در رقابت نگه داشت.