توسعه هوش مصنوعی با بازی StarCraft II
به گزارش واحد فناوری اطلاعات سایبربان؛ آزمایشگاه دیپمایند گوگل (DeepMind) که مدتی قبل با ساخت هوش مصنوعی آلفاگو (AlphaGo) توانست برای اولین بار قهرمان بازی تختهای گو1 (Go) را شکست بدهد، به تازگی اعلام کرد با شرکت بازیسازی «بلیزارد» (Blizzard Entertainment)، همکاری خواهد کرد تا از بازی استارکرفت 2 (StarCraft II) به عنوان بستری برای آموزش هوش مصنوعی و الگوریتمهای یادگیری ماشینی استفاده کند. این بستر به برنامه نویسان هوش مصنوعی در سراسر دنیا اجازه میدهد تا هوشهای مصنوعی خود را با کمک آن توسعه دهند.
پژوهشگران آزمایشگاه دیپمایند معتقدند مجموعه استارکرفت از 20 سال پیش تا کنون بهعنوان یک بازی ویدئویی رقابتی 1 به 1 شناخته شده و یکی از بهترین بازیها در رایانههای خانگی و در سبک «استراتژی همزمان» (RTS2) است. از اواخر دههی 90 از این بازی برای انجام مسابقات ورزشهای الکترونیکی استفاده میشود و در آن بازیکنهایی بسیاری حرفهای به رقابت با یکدیگر میپردازند. از طرفی شرکت بلیزارد نیز سعی میکند بهصورت دورهای بروزرسانیهای متنوعی برای متعادل نگهداشتن بازی عرضه کند.
پژوهشگران هدف خود از همکاری با بلیزارد را گسترش مرزهای هوش مصنوعی اعلام کردهاند؛ زیرا این پروژه میتواند به توسعهی فناوری هوش مصنوعی، بدون نیاز به تزریق اطلاعات اولیه به آن و آموزش روشهای حل مسائل پیچیده کمک کند. آنها محیط یک بازی را فضایی عالی برای توسعه و آزمایش هوش مصنوعی و ایجاد سریعتر الگوریتمی مؤثرتر و منعطفتر میدانند. بهعلاوه استفاده از یک بازی باعث میشود تا بازخورد عملکرد آن سریعتر به دست آید.
زمانی که بازی استراکرفت شروع میشود، بازیکنها باید یکی از سه نژاد موجود را که هر یک نیروها و ویژگیهای خاص خود را داشته و روش بازی متفاوتی را میطلبند انتخاب کنند. بعد از این کار و شروع رقابت بازیکنها باید به جمعآوری منابع اولیه بپردازند و با مدیریت آن، ساختمانها و نیروهای مختلف را برای مبارزه با دشمن ایجاد کند. در این بازی هر دو بازیکن به صورت همزمان شروع به ساخت و توسعهی پایگاه خود میکنند؛ اما هیچیک از نقشه و محل قرارگیری حریف شناختی نداشته و برای آشنایی با آن باید نیروهایی را برای شناسایی به اطراف ارسال کنند و اطلاعات به دست آمده را برای مدتزمانی طولانی و تا پایان رقابت به یاد داشته باشند. از طرفی هر دو بازیکن بهصورت همزمان فعالیت میکنند در نتیجه باید از سرعت عملکرد بالا برخوردار بوده و بتوانند در کوتاهترین زمان بهترین تصمیم را بگیرند. همین موضوع، انجام این بازی را بسیار پیچیده کرده، آن را در برابر بازی تختهای گو - که از همان ابتدا تمام محیطش قابل مشاهده است - قرار میدهد.
برای آموزش هوش مصنوعی، محققان باید آن را بهصورت یک عامل که میزان مشخصی حافظه را به خود اختصاص داده است استفاده کنند تا بتواند برنامهریزیهای طولانی مدت انجام بدهد. رایانهها عملکرد سریعتری نسبت به انسان دارند؛ اما این موضوع به معنای باهوشتر بودن آنها نیست؛ بنابراین باید عملکرد عاملها را در محدودهی توان انسان محدود کرد؛ زیرا بازیکنها باید با موشواره و صفحهکلید کار کرده و پیوسته دوربین بازی را به اطراف حرکت بدهند و همین موضوع سرعت آنها را کاهش میدهد.
پژوهشگران گفتند: «ما با همکاری شرکت بلیزارد در حال آمادهسازی یک رابط برنامهنویسی نرمافزار (API) هستیم و آن را در اوایل سال آینده منتشر میکنیم. این رابط به مهندسان سراسر دنیا اجازه میدهد تا عاملهای هوش مصنوعی خود را ایجاد کرده و آن را با استفاده از بازی استراکرفت 2 آموزش دهند.»
پژوهشگران افزودند: «آزمایشگاه دیپمایند با شرکت بلیزارد برای ایجاد سناریوهای آموزشی همکاری میکند. این موضوع به محققان اجازه میدهد تا عاملهای خود را بر اساس میزان آموزشی که دیدهاند در سطوح مختلف آزمایش کرده و توسعه بدهند. همچنین به آنها اجازه داده میشود تا مأموریتهای خاص خود را نیز در بازی ایجاد کنند.»
البته اولین دفعهای نیست که شرکت گوگل برای انجام تحقیقات هوش مصنوعی از یک بازی ویدئویی استفاده میکند. به عنوان مثالی برای این موضوع میتوان به شبیهساز اتومبیلرانی «ترکس» (Torcs) اشاره کرد.
شرکت مایکروسافت نیز در اقدامی مشابه، امکانی را در بازی ماینکرفت فراهم کرده است تا محققان بتوانند از آن برای آموزش و توسعهی هوش مصنوعی خود استفاده کنند.
_________________________________
1- بازی گو، یکی از قدیمیترین بازیهای تختهای جهان است که از یک صفحهی شطرنجی 19 در 19 تشکیل شده است و با وجود دارا بودن قوانینی ساده، پیروزی در آن بسیار مشکل است.
2- Real-Time Strategy